使用OCR光學字元辨識,增強Cloud Search對包含圖片的 PDF 檔案搜索結果

Google Workspace 功能新知

2021-05-25


使用OCR光學字元辨識,增強Cloud Search對包含圖片的 PDF 檔案搜索結果

Google 在此次更新了 Cloud Search 在搜尋包含圖片的 PDF 檔案時能夠以光學文字辨識(OCR)技術來找到這些圖片,比如以紙本發票或合約中的文字作為搜尋條件。

Cloud Search支持內容索引辨識的文件類型列表

  • 微軟 Word (DOC)
  • 微軟 Word (DOCX)
  • 微軟 Excel (XLS)
  • 微軟 Excel (XLSX)
  • 微軟簡報 (PPT)
  • 微軟簡報 (PPTX)
  • Adobe 可攜式文件格式 (PDF)
  • 多文字格式 (RTF)
  • 文本格式 (TXT)
  • 超文本標記語言 (HTML)
  • 可擴展標記語言 (XML)

光學字符識別 (OCR) 文件類型和特徵

文件類型最大尺寸
聯合圖像專家組 (JPG)10 MB
圖形交換格式 (GIF)10 MB
標籤圖檔格式 (TIFF)10 MB
可縮放矢量圖形 (SVG)10 MB
PostScript 圖像格式 (PS)10 MB
便攜式文件格式 (PDF)30 MB

影響用戶

  • 管理員: 預設情況下此功能為開啟,需要更多資訊可以參考官方文件
  • 一般使用者 : 對一般使用者沒有影響

功能發布時間

快速發布和定期發布網域 : 此更新現已可用

更新適用版本

  • 適用於 Google Workspace Enterprise Plus和Google Cloud Search客戶
  • 不適用於 Google Workspace Essentials,Business Starter,Business Standard,Business Plus,Enterprise Essentials,Enterprise Standard,Education Fundamentals,Education Plus,Frontline和非營利版,以及G Suite Basic和Business客戶
相關部落格文章 :

(本文改譯自 5/24 Google Workspace Blog

Google Workspace 遠端居家辦公方案 | 帶你完美詮釋整個城市都是你的辦公室