好讀首頁 世紀百強 | 隨身智囊 | 歷史煙雲 | 武俠小說 | 懸疑小說
言情小說 | 奇幻小說 | 小說園地 | 有聲書籍 | 好讀新聞

《用掃描器製作電子書》楊宣文 2008/12/28

我記得周博士在好讀網站倡議要製作「世紀百強」電子書大約是三年前的事了,經過美格騰和讀友長期的努力,大約收集了七、八成,但是剩下的幾本,可能是出版年代很早或是較不出名,無論在網路或書店中都遍尋無蹤,好不容易在圖書館找到一本,使用掃描器掃描成影像檔案,再使用OCR程式辨識成文字檔,然後分發給讀友做校對整理,團結力量大,很快就看見成果,如《藍與黑》《尹縣長》都是這樣製作出來的。

相信每位讀友都有幾本珍藏的愛書,可能都願意貢獻出來,製作成電子書,然而要如何做,才是最有效率的作法?

印表機應該是每個人都有,不論是噴墨、雷射或最早的撞擊式印表機,但是掃描器不見得人人都有。即使有,應該也是為了掃描相片或幻燈片而買的,很少有人為了掃描文件而去買掃描機。掃描相片和掃描文件這兩件事看起來類似,但骨子裡卻大不相同。

一般人掃描相片,大致有兩種用途,一種是美工編輯需要掃描一些圖片作為構圖的元素,另一種則是為了將傳統相片掃成電子檔案,便於儲存。但是這幾年數位相機幾乎是橫掃市場,大概已經沒有人再使用傳統相機了,即便是專業攝影師也都使用數位相機,然後以專業程式修圖,為了掃描相片而設計的掃描器幾乎已經被擠到3C賣場的角落了。

那麼掃描器到那裡去了?除了專業的文件掃描器外,一般消費者所會使用的掃描器都整合到MFP(Multi-Functional Printer)中,不論是HP、Canon、EPSON、Lexmark等廠家都走上這條路。

所謂的MFP就是整合列印、影印、掃描、傳真等功能於一身的小型事務機,其中列印的種類決定了MFP的主要價格,以現在的市場價格而言,雷射列印的MFP約台幣1到2萬元,而噴墨列印的MFP則多在台幣1萬以下。掃描的方式則和之前一樣,以掀蓋平台式(Flatbed)為主,只是掃描尺寸由A3縮小為A4。用掀蓋平台式的MFP掃描書本蠻辛苦的,曾經當過學生複印教科書的,都能體會其中甘苦,掃描一本厚達4、500頁的書,大概得花掉一個多小時,而且品質不見得很理想:由於書本的厚度,會產生黑邊、字體歪斜模糊等問題,在後續進行OCR辨識時會產生一些問題。

後來,因為MFP加入了傳真功能,多張送紙的需求也因運而生,廠商也推出了有自動送紙功能(ADF)的MFP。如果手上有這類型的MFP,只要捨得把書本拆開、切邊,就可以用ADF一次掃描多頁,比用掀蓋平台式的MFP快上好幾倍,而且掃描的品質也可以控制。但是還有一個缺點──只能掃描單面,因為一般的傳真文件只需要單面掃描即可。這倒可以用掃描軟體的功能來解決──先掃描單數頁,再掃描偶數頁,然後自動歸到正確的頁數,只是掃描的次數多增加一次。

還有另外一種方法,如果剛好公司裡面有一台大型的事務機(也就是我們以前俗稱的影印機),不管是Xerox, Canon, Ricoh等廠牌,只要是新的、數位型的,也大都備有ADF,也可用於掃描書本。但請先檢查一下掃描功能是否啟用?有些事務機的掃描功能是要另外購買的。如果可用,就可以將拆開、切邊後的書本當作是一疊厚厚的文件掃描後或寄(email)或存(FTP或SWB)到你的電腦中。還有些公司用到更好的事務機,是備有雙面自動送紙功能(DADF),那麼恭喜了,一次就可以掃描完了。

最後一種方式,也是最理想的,就是手邊有一台專業的文件掃描機。這類型掃描機要對付的文件種類百百種,可說是功能強大,掃描書本簡直是牛刀小試。這類型的掃描機以前大概只有政府機關和大型民營機構如醫院、律師、會計師事務所才有能力購買使用,一般的小老百姓是無能力也沒必要去使用。但隨著技術的演進,也慢慢有一些消費型的產品問世。

以上這四類型的掃描機,將來有機會另文來說明。

這篇文章主要是要說明:如何掃描實體書本成為電子書。

為了這個目的,我找了四本舊書,徹底地拆開、切邊,然後掃描、OCR,嘗試用不同的應用程式處理、切割,最後用mPDB整理、校對。整個流程走一遍,希望能夠找出最有效率的方式。

我先以一本高陽寫的《荊軻》小說(480頁)做範例說明:

1、掃描前的處理(約20分鐘)

拆書──用刀片將書背的線裝拆開
修邊──以裁刀將書頁連接處裁掉

2、掃描(約10分鐘)

我手上剛好有一台專業文件掃描機(Canon DR2510C),大小和一台小型的噴墨印表機相當,雙面掃描每分鐘可達25張(50頁),彩色、黑白皆可,解析度可達600dpi。
我以CapturePerfect(搭配的掃描軟體)掃描成TIFF檔案格式(黑白、400dpi),約20MB

3、OCR(約10分鐘)

接著以RosettaStone做OCR辨識,得一文字檔,約500K

4、製作分工檔案(約50分鐘)

將文字檔分成六部分,便於分工校對
再以mPDB刪除空白字元、分隔段落,看起來比較清爽
將400dpi的TIFF檔案切割成六個檔案,再轉成200dpi的PDF檔案,縮小檔案大小便於傳遞

5、自己先整理校對了第一段(約2小時)

大約花了3~4小時,就可處理完一本書,送上網站讓其他讀友可以協助整理校對。

好讀首頁 有關好讀 讀友需知 聯絡好讀

搜尋好讀 - Google

按這裡用 Microsoft Bing 搜尋好讀
好讀第24年了
有好讀真好,有你也真好。但不知遍及各地的你,究竟有多少。若你從未或很久沒贊助過好讀,請按這裡,贊助好讀也讓我們知道你的鼓勵與支持。

2024/5/8 rc
去年偶然發現好讀,覺得這裡根本是寶藏天地!謝謝每一位在幕後默默耕耘文學天地的人。

2024/5/7 呢
用好讀許多年了,感謝重新更新,也感謝大家的付出!

2024/4/4 R
這里居然能找到哈維爾.西耶拉的書!驚喜萬分!希望能讀到更多這位歷史小說大師的作品!感恩每一位好讀團隊!

2024/3/14 Beatlebum
在好讀挖寶好幾年,以為好讀不會更新了,但還是偶爾會上來看看,沒想到又有新書了,超級感動!好讀真的陪我渡過好多個通勤的日子跟愜意的週末,謝謝好讀!

2024/3/9 Christine
好讀是我這個文字工作者隨時隨地的好朋友,我有空就上來,給我許多精神糧食,伴我度過許多白天黑夜,有好讀,真好!非常感謝幕後團隊。

2024/2/19 He Zhong
非常非常感谢好读,许多外面找不到的书都在这里找到了,找书的过程,好读给了我非常大的帮助!

2024/1/13 Vanessa Chen
隔了七年才又上來,才知周先生離開了。很高興曾有機會參與好讀,透過網路與周博士共事(真也才知道的,一直只稱呼周先生的),感謝好讀團隊!也和過去一樣,給周先生的文末"祝您闔家平安健康"~願他家人心安~

2024/1/7 強
第一次知道好讀的時間不久,大約兩年前。當時常在這裡挖寶,本來很擔心網站會隨著周博士離世而無法再運作,今日再來發現網站動起來了,真心、真心地感謝願意付出的善心人士們。無法想像沒有閱讀的人生,閱讀的路上有您們真好。

2023/12/27 Annabel Kuo
上高中後有了手機發現的,非常感謝。我本身是個很愛閱讀的人,我感到若我活著而不去欣賞這一種人類的藝術那將毫無意義可言。總而言之,萬分感謝,我不知道在每有能力買書學校圖書館又只能借七天的情況下,沒有這個網站我的生命會是多麼的荒蕪。

2023/12/12 Yumi
幾年前偶然得知周博士離世的消息,來到好讀網站總會覺得有點悵然,也以為不會再運作了。今年為老父親添購電子閱讀器,抱著試一試的心情再度連上好讀,沒想到繼續運作,還有這麼多讀友再度回來這裡,感覺很溫暖,謝謝好讀與團隊們的努力。

2023/11/27 Helios
能在这里发现赤川次郎、鬼马星和高羅佩的作品,太驚喜了!感謝好讀書櫃!

2023/11/19 Moon
偶然間發現這個網站,如獲至寶,更找到小時候很喜歡的一本書終於出現電子版,感謝團隊的無私分享,謝謝好讀!

2023/11/18 Michael
无意间想起过来好读怀念一下。竟然是惊喜!好读活过来了!感恩 感谢。

2023/11/5 angsila
每周上好读看看是否有新书,这已经成了一个习惯。这种陪伴是一种舒服的,充满确定感的安心。感谢好读。

2023/10/30 Vincent
從武俠小說開始接觸到好讀,陸陸續續也看了很多好書,六年前看到周博士的消息覺得十分不捨與可惜,時隔多年發現好讀又重新運作了,實在感到非常開心與感謝!

2023/10/23 偷泥
2019年的某天,我在這裡遇見了薩豐的風之影,便開啟了我的閱讀之路,才知道原來閱讀是一件多麼快樂的事情。2023年的今天,我依然在這裡遇見一本本的好書,真心感謝好讀!

2023/10/7 Young
自2017年後,時隔六年才發現好讀又開始運作了,真的充滿深深感謝。

2023/10/4 JOE
好多年前,在好讀發現艾西莫夫的基地系列,還有科小說海伯利昂,讓我在年輕歲月,住在忠孝東路旁玉成公園附近的時候,獲得了很多閱讀的樂趣。時隔多年,又想在好讀看點書,到了今天,我第一次在好讀把村上春樹的收音機2讀完,感謝好讀~

2023/10/3 snow
非常喜歡好讀,感謝好讀無私的付出與陪伴的歲月。永遠支持好讀。祝福好讀長長久久。

2023/9/24 Tomcat Chou
從2006年起,好讀就這麼伴我度過了這麼長的時間。直到2017.12的噩耗傳來,我以為就此不再見好讀。直到今日,偶然想起老朋友,想不到好讀還在,令人又驚又喜。祝福好讀,好讀長存。

2023/9/24 王俊文
眼力不好,多年沒來好讀看書,今天再訪好讀方知周劍輝博士已往生,不勝唏噓,希望他安息天國。沒有他的辛苦創建及許多熱心朋友的共同努力,好讀不容易經營至今。謝謝周博士及熱心朋友的辛勞貢獻!

2023/9/12 Charlotte Chang
想不到今天上網查看,好讀竟然復活了,是哪位神仙壯士伸出援手?還沒仔細搜尋來龍去脈,已喜極而泣。這嘉惠眾多書友但卻無啥收益的苦工,真的需要有很多愛才能繼續下去,祝福新版主,謝謝您!好人一生平安!

2023/9/5 小張
喜愛好讀網站及電子書本 很多年月了。從武俠小說起始,到各種書類,幸得有心人製作電子本供方便取用閱讀,非常感謝。

2023/8/18 璐羽
第一次知道好讀是無意間發現的,並且發現的那天令我驚喜且意外的是—剛好是好讀復活不久之後,覺著應該是某種莫名的緣分,促使想找些電子書的我被帶到了這裡。這裡有著各位前輩們辛苦掃描、品質極佳的電子書,讓我這個後人能夠免費享用這些書籍,十分感激前人的努力讓我成了書籍的富翁。感謝好讀和各位讓好讀變得更好,讚。

2023/7/26 袁樹國
好些書都沒有prc檔案,有點遺憾!重新上架還是令人高興,加油!

2023/7/20 KYLESONG
大概2010知道好讀, 就三不五時來此找書, 原本只有看書時順便回報一些文字勘誤, 後來2015開始幫忙周博士製作電子書, 主要是OCR檔案的文字校對, 也曾經掃瞄了一,二本書進行校對提供txt, 周博士也幫忙製作了電子書格式上架, 非常感念~ 可惜後來2016年中事忙, 暫停了校對的支持, 再後來就是看到周博士由友人的公告....當下難過且震驚, 雖然還是偶而會上好讀看看, 但是看到周博士曾經的發文還是心中不捨, 終於, 今天久違的上線,看到新版主的通知, 開心不已, 也希望周博士在天上也是同樣歡欣.

2023/7/18 Mac
翻書抽屜內的Kindle,很舊沒有開啟了使我再與好讀相遇。期待重拾讀趣,祝讀趣再次重臨好讀及各位讀者。

2023/7/18 池子
十年前发现好读,获得了很多排版非常好的电子书,现在还有当年下载的很多书存在kindle里。好久没来竟发现版主周先生已经过世令人不胜唏嘘。感谢周先生带来好读,给予纷繁复杂的网络一方书香雅地。

2023/7/14 甲魚
好讀的出現,使我重措對書籍的興趣,它提供了一個便利的途徑來發掘好書,希望這個網站能繼續為其他有興趣的讀者服務。

2023/7/8 歌
讀書時期用pocket pc 看書持資源發現了好讀,然後好讀一直陪伴我至大學畢業然後踏足社會。雖然工作事忙,但是上好讀網閒逛看黃河散文已成一種習慣,直至發現好讀不再更新,繼而停站,再從別的論壇得悉網主離世一事,心有點哀傷,後悔未曾跟他言謝在學習期間他的網站是我的精神食糧。見到好讀重啟,有心人延續好讀網站的營運和更新,很是感激,對周先生的貢獻亦致萬分感謝!

2023/7/4 葉扁舟先生
相识十年,前面看过不少好书,谢谢你。今年时间更多了,希望在haodoo度过更好的年华。

>> 更多感言