Oss Document Scanner文檔掃描儀是一款開源應用程序,用于掃描您的所有文檔。您可以使用相機或導入圖像進行掃描。在掃描時能夠自動檢測照片中的文檔并裁剪圖像。創建文檔后,您可以使用 OCR 檢測文檔中的文本。您還可以以 PDF 形式共享您的文檔。如果您愿意,您可以將應用程序數據與 webdav 服務器(例如 nextloud)同步,以免丟失任何內容!
開源且集成 OCR:
基于 Tesseract OCR 引擎(需手動下載語言包),支持中、英、日等多語言文本識別。
掃描結果可直接導出為帶 OCR 文本層的 PDF,實現 “所見即所搜”。
智能圖像處理:
自動矯正文檔角度、去除陰影,支持邊緣檢測和透視變換。
提供 “增強模式” 優化低光照或模糊圖像,提升 OCR 準確率。
輕量化與兼容性:
體積僅 5MB,適配 Android 5.0 及以上系統,可從 F-Droid 直接安裝。
支持導出為 DOCX(需安裝 Microsoft Office 插件)和純文本格式。
使用場景
學術研究:掃描論文并提取文本,方便引用和編輯。
數據錄入:批量掃描表格或手寫筆記,通過 OCR 生成結構化數據。
跨境業務:掃描多語言合同,結合翻譯工具(如 Crow Translate)實現實時翻譯。
一、基礎操作:快速上手掃描功能
1. 啟動與界面導航
首次啟動:打開應用后,主界面顯示 掃描(Camera) 和 導入(Import) 按鈕。
界面布局:
頂部工具欄:包含 濾鏡(Filter)(黑白 / 灰度 / 增強)、批量掃描模式(可連續拍攝多張文檔)、設置(Settings)。
底部操作欄:快門按鈕(掃描當前畫面)、相冊導入(從本地選擇圖片處理)、已保存文檔列表。
權限授予:首次使用需允許 相機 和 存儲 權限,否則無法掃描或保存文件。
2. 掃描文檔的標準流程
步驟 1:取景與對焦
保持文檔平整,光線充足,將手機攝像頭對準文檔。應用會自動檢測文檔邊緣并顯示 藍色邊框。若邊緣檢測不準確,可手動拖動邊框四角調整。
步驟 2:拍攝與優化
點擊快門后,應用自動校正透視畸變,并提供 增強模式(去除陰影、優化對比度)。建議開啟 自動增強(在設置中啟用)以提升掃描效果。
步驟 3:編輯與裁剪
掃描結果進入編輯界面后,可:
手動裁剪:拖動邊框調整掃描范圍,支持放大鏡輔助精確選擇。
添加濾鏡:選擇 黑白模式 提升文字清晰度,或 灰度模式 保留原始色彩。
旋轉 / 翻轉:點擊旋轉按鈕調整文檔方向。
3. 批量掃描與自動保存
批量模式:
點擊頂部 批量掃描 按鈕,可連續拍攝多頁文檔。應用會自動生成多頁 PDF,適合掃描書籍或合同。
自動保存設置:
在 設置 → 保存路徑 中選擇默認存儲位置(如內部存儲 / SD 卡),并開啟 掃描后自動保存,避免因誤操作丟失數據。
二、核心功能:OCR 文字識別與導出
1. 啟用 OCR 識別
觸發方式:
掃描完成后,點擊編輯界面底部 OCR 按鈕(或在已保存文檔列表中長按文件選擇 “識別文本”)。
語言包下載:
首次使用 OCR 時,應用會提示下載 Tesseract 語言包(如 “chi_sim” 中文簡體)。可在 設置 → OCR 語言 中手動添加其他語言(如英語、日語)。
識別參數調整:
增強模式:開啟后優化低光照或模糊圖像的識別效果。
識別區域:框選文檔局部進行精確識別,適合提取表格或特定段落。
2. 導出與格式選擇
導出選項:
識別完成后,點擊 導出 按鈕,支持:
PDF(帶 OCR 文本層,可搜索):適合存檔或分享。
DOCX(需安裝 Microsoft Office 插件):導出為可編輯文檔。
TXT:純文本格式,適合快速復制內容。
高級設置:
在導出前可調整:
分辨率(建議 300 DPI 用于印刷)。
壓縮率(平衡文件大小與清晰度)。
書簽生成:自動為多頁 PDF 添加章節書簽。
3. 驗證與編輯識別結果
文本校對:
導出前點擊 預覽,查看 OCR 識別結果。長按文本可手動修改錯誤(如 “未” 識別為 “末”)。
多語言混合識別:
掃描包含中英文的文檔時,需在 設置 → OCR 語言 中同時勾選 “中文” 和 “英文”,確保混合文本準確識別。
三、高級技巧:優化掃描與識別效果
1. 圖像預處理策略
光線與角度:
避免文檔反光,可使用臺燈從側面補光。
保持手機與文檔垂直,減少透視畸變。
背景處理:
掃描時選擇純色背景(如白色墻面),避免復雜圖案干擾邊緣檢測。
啟用 背景去除 功能(在濾鏡中),自動虛化背景。
2. OCR 準確率提升方法
圖像增強:
使用 黑白濾鏡 突出文字與背景的對比。
手動調整 對比度 和 亮度(在編輯界面滑動底部調節條)。
字體與排版適配:
對于手寫筆記,啟用 手寫識別模式(在 OCR 設置中)。
掃描表格時,確保表格線清晰,必要時使用 增強模式 強化線條。
3. 與其他工具聯動
文本編輯:
導出 DOCX 后,可通過 Umi-OCR(開源 OCR 工具)進一步校正識別錯誤,或使用 Crow Translate 進行實時翻譯。
云存儲同步:
在 設置 → 自動同步 中關聯 堅果云 或 Nextcloud,掃描結果自動上傳至云端,實現多設備共享。
Q1:OCR 識別結果不準確
A:
檢查語言包是否下載完整(進入 設置 → OCR 語言 確認)。
重新掃描文檔,確保文字清晰、無傾斜。
嘗試切換 增強模式 或 黑白濾鏡。
Q2:導出的 PDF 無法打開
A:
確認導出路徑正確(在 設置 → 保存路徑 中查看)。
使用第三方 PDF 閱讀器(如 Adobe Acrobat)打開,避免系統自帶閱讀器兼容性問題。
Q3:批量掃描時自動合并失敗
A:
確保批量掃描模式已開啟(頂部工具欄按鈕高亮)。
掃描過程中不要頻繁切換頁面,保持文檔內容連貫。