最新文章

發佈時間:2017-11-02 (更新:2017-11-02 22:28)發佈者:hurt
標題:淺談 OCR 與視障學生之學習

  先簡單解釋一下 OCR 的原理,一般紙本文件透過拍照或掃瞄進入電腦時,是屬於圖片檔的形式,和風景、人物照片是一樣的, OCR 軟體全名 Optical Character Recognition 光學字元辨識,它的功能就是把圖片檔中的影像,去比對它的資料庫,看它比較像哪一個字,就把它轉成那個字,最後儲存文件檔,像是 word 的 doc 檔,或是記事本的 txt 檔。

了解 OCR 的原理之後,我們就可以來看它的侷限:

  • 文本的清晰度:包含文件本身、掃瞄器品質、拍照品質,如果清晰度不夠或文本中干擾的訊息太多,就會影響它的清晰度,例如有表格的地方就可能會有問題,拍照如果把影子也照進去了,也會影響正確率,其他像是手寫註記、畫重點、不規則排版(多欄或插圖)等都會有影響。
  • 數理符號的部份:目前 OCR 的技術僅能就不同語言做區隔辨識,還有簡單的數字辨識,無法將數理符號(分數、根號、指數等)辨識並輸出。
  • 圖形部份:基於它的原理,頂多能抓出圖形中的文字,甚至有些線條也會被誤判成文字,而多了很多不必要的訊息;圖形問題目前 OCR 技術層面是無法克服的,而且也沒有對應輸出的管道。

  對於較重度的視覺障礙學生而言,課外的學習資料在圖形的部份,可以參照國中教育會考的方式,能夠改成文字敘述的,就以文字敘述代替,如果較簡單的圖形,則用專門的軟體製作,再加上點字,最後使用點字圖形印表機印出,或是用其他人工方式製作,無法改成文字敘述也無法製作觸摸圖形的題目則予以刪除。

  圖形改文字敘述的部份,因為各科目都是很專業的內容,適合由各科老師直接將圖片轉成文字敘述,會更貼近試題原意。

  觸摸圖形的部份,要經過軟體轉換、人工調整、點字處理再送列印,或是其他人工方式製作,一張觸摸圖形的製作要花 10 分鐘到半個小時以上,相當耗費時間,而且製作出來的圖形不保證學生摸得出來,因為要將觸摸到的線條在頭腦裡組織成圖像,除非有摸過類似的圖並經過解說,否則會有很大的困難。

  所以個人淺見,將書面紙本資料掃瞄、辨識、校正其實是很花時間和人力的,圖形的部份也無法克服,如能直接取得資料文字電子檔,對於視障學生的學習會更直覺,除非無法取得電子檔或相關替代資料,才考慮使用 OCR 。

  至於圖表部份,可先以點字課本有提供的為主,或是將圖形改成文字敘述,前兩者均無法達成目的,才考慮製作觸摸圖形。