台一網站上的資訊僅供參考,並不構成任何個案法律建議或服務。這些資訊不必然代表本所或其客戶的觀點。如果您需要法律和智慧財產權建議,請不吝諮詢我們。
本網站使用Cookies以提升您的瀏覽體驗,繼續使用本網站即表示您同意我們使用Cookies。

人工智慧相關專利檢索策略─以近期發表的兩大報告為例

2019.07.01

226 期

人工智慧相關專利檢索策略─以近期發表的兩大報告為例

More Detail

前言

人工智慧 (Artificial Intelligence, AI) 被稱作第四次工業革命的核心,相對於前三次的工業革命,它對未來人類生活形式和產業發展的影響將更為巨大[1]。研究一項科技的發展狀況,最直接而客觀的方法不外乎是檢索該項技術相關專利及論文的數量。專利資料庫是檢索專利的基礎,而現今各種專利資料庫在更新頻率、日期範圍、涵蓋國家、專利分類、後製處理等各方面都有不同;因此即使同樣的檢索條件在不同的專利資料庫中檢索都會產生不同的結果。商業 (付費) 專利資料庫的優點除了多國同時檢索之外,更在於修正的書目資料、擴充的名稱及摘要以及改良的分類與索引,同時也提供複雜的檢索及分析工具。本文藉由最近兩份有關AI相關專利申請的重量級報告來說明檢索策略的重要性。

《人工智能技術專利深度分析報告》

此報告是由中國專利保護協會於2018年11月所發表,以德溫特世界專利索引 (Derwent World Patents Index, DWPI) 資料庫作為資料來源,並使用相關行業專家和相關技術領域專利審查專家共同給出的AI領域的中英文關鍵詞進行檢索;最終再使用專利分類號對結果加以限制而得到此報告如圖1的數據[2]。圖1顯示中國是全球最大的AI專利申請國家,擁有76,876件專利申請;而台灣也名列全球第8位 (歐洲名列第5),擁有3,845件專利申請。

 

圖1、專利申請量排名前十的國家/地區

此報告在DWPI資料庫中針對AI領域在全球的專利申請進行檢索,共獲得專利申請180,617件 (檢索日期2018年10月15日)。為了避免引入過多雜項以力求檢索結果準確,檢索策略的確定著眼於兩個標準:一是提高準確度,避免雜訊;二是注重AI的主要應用領域和技術分支,尤其是軟體、演算法相關發明專利申請。

截至2019年5月,DWPI資料庫覆蓋全球59個專利授權機構和2個文獻來源 (30多種語言,其中86%的抽象記錄源自非英語專利記錄),包含超過8,280萬個專利檔。DWPI資料庫的特色在於增強了權威和準確的專利資料;主題專家提供清晰的標題,摘要總結了發明的新穎性/進步性,並且對書目錯誤進行了校正。據稱平均而言有18%的檔案需要糾正錯誤,所以超過40個專利局向其提供原始資料然後再向其購買DWPI資料庫以做進一步分析。DWPI資料庫的專利家族可以確保不會檢索到重複的發明,基於去重的記錄使得可以看到單個發明的全面保護,而不是每個專利的一個記錄。DWPI資料庫使用無偏頗的編碼和索引系統將20多個Derwent分類和超過2萬5千個的有效手動代碼應用於每個記錄,可提供優越的檢索性。

WIPO Technology Trends 2019: Artificial Intelligence

此報告是由世界智慧財產組織 (World Intellectual Property Organization, WIPO) 於2019年1月所發表,使用FamPat資料庫截至2018年3月31日的資料所分析如圖2的數據[3]。圖2顯示美國是全球最大的AI專利申請國家,擁有超過15萬件專利申請;而台灣也名列全球第11位 (WIPO及EPO分別名列第4及第5),擁有近1萬件專利申請。

 

圖2、經由專利局所申請的專利 (已省略排名較後之專利局以便於檢視)

FamPat資料庫對全球超過百家專利授權機構的專利申請及授權專利進行索引,通過將所有主張完全相同的優先權號的申請加以群組來構建專利家族以對應於相同的發明。此報告進行專利檢索時,FamPat資料庫約有5,930萬個專利家族。在此報告中,所有的數字都是以專利家族的數量給出,以便相同發明的不同申請只計算一次。除非特別註明,圖表中使用的日期都是最早優先權案的申請日期。

此報告中提出的檢索策略旨在實現一個目標,也就是在儘可能收集所有形式和領域之AI相關技術的專利,同時將必然出現的誤差控制在最小的範圍,所以選擇將大部分檢索策略建立在分類代碼的使用上。當技術領域相當大而且相關發明與AI的關係不總是那麼清楚明確時,分類代碼可以克服基於關鍵詞檢索的限制。但是,目前常見的分類系統之間存在一些重要差異,不論是範圍、完整性、精確性和結構,CPC、IPC和FI/F-terms都不相同;因此在最終檢索中需要區別對待不同的分類系統。此外,AI發明可能不總是歸類於AI特定的子組;為達到完整性,需要仔細考慮更小的AI特定分類。此報告選擇使用擴展的關鍵詞列表來控制這類的干擾。無論如何,相對大量的AI相關專利並未歸類為與AI相關的分類代碼,只能使用關鍵詞獲取,因此檢索的一部分必須基於特定關鍵詞。所有分類都使用FamPat資料庫進行了測試,並且檢索結果的樣本也經過人工檢查,以衡量分類的相關性以及特異性的程度。所使用的關鍵詞是審核現有文獻和網絡資源的基礎上所選擇。所有的檢索字串,分類代碼和關鍵詞都可以在參考文獻[4]找到。

初步檢索結果使用內建的文本挖掘工具進行控制,最終檢索結果則使用反覆運算測試程式:每個查詢的添加或修改都通過文本挖掘以識別干擾源且/或使用額外的關鍵詞。此檢索建構過程所建立的第一次結果包含了369,211個專利家族,接著果然有幾個干擾源經由使用統計工具和文本挖掘被確定。大部分的干擾源為自動化相關的舊專利家族 (1975年以前提申) 並通過非AI分類代碼所收集。另位,非AI計算方法導致的其他干擾源包括浮水印嵌入、資料庫管理和廣告等。經過此控制程序之後,最終檢索結果包含339,828個專利家族。

結語

經由以上的說明可以看出中國專利保護協會所發表的《人工智慧技術專利深度分析報告》相對世界智慧財產組織所發表的WIPO Technology Trends 2019: Artificial Intelligence,在檢索條件的說明上較為簡略;不過整體而言,後者也由於特殊的統計工具、文本挖掘和人工檢查而無法輕易複製其檢索結果。因此針對世界各國申請AI相關專利的統計,兩者不但在數量上有所差異,排名順序上也有所不同。無論如何,與其說客觀上何者較為準確,倒不如說主觀上對於何者 (檢索策略) 較為偏好罷了。

參考文獻

[1]  楊雯芳,〈正視人工智慧的發展,採取積極主動的措施〉,《台一雙週專利電子報》第214期,2019年3月14日。
[2] 《人工智能技術專利深度分析報告》,中國專利保護協會,2018年11月。
[3]  WIPO Technology Trends 2019: Artificial Intelligence, Geneva: World Intellectual Property Organization, 2019.
[4]  Data collection method and clustering scheme, Background paper for WIPO Technology Trends 2019 Artificial Intelligence, Geneva: World Intellectual Property Organization, 2018.

 

聯絡我們

CONTACT

聯絡我們 Line Facebook 電話
Line通話 Line對話
Line通話 Line對話
Line通話 Line對話
Line通話 Line對話