- 相關推薦
基于專利共被引的世界500強企業技術競爭的專利地圖分析
引言
在科學文獻的引用行為中,引用動機大多是出于正面因素,例如向開拓者致敬(credit topioneer),對有關著作給予榮譽(honor to literature)等等,因此科學文獻的引用體現出了一種知識的繼承關系。與科學文獻的引用動機不同的是,專利文獻的引用動機則大多旨在指出所引用技術的問題、不足或缺陷,表達著對所引用技術的否定態度[1],所以專利的引用表達的更多的是技術的競爭關系。
技術競爭情報(Competitive Technical Intelligence)是指能給組織的競爭地位帶來重大影響的外部科學或技術的威脅、機會或發展的信息,以及這些信息的獲取、監控、分析、前瞻和預警過程[2]。專利計量方法已經成為企業技術競爭情報研究的一種主要手段[3, 4]。
在此前的研究中,作者通過建立大型專利共被引矩陣,對世界500 強中的工業企業的專利發表強度、被引情況、專利共被引網絡進行了研究[5]。本文在以往研究的基礎上,基于企業專利前向引用構建企業專利共被引矩陣,結合科學計量學領域近年來迅猛發展的信息可視化技術,對世界500 強企業進行技術競爭地圖分析。
1 國內外研究現狀
1.1 專利計量方法
作者在Web of Science 數據庫(SCI、SSCI、A&HCI)和中文CNKI 中檢索專利的相關文獻,檢索發現,目前關于專利的研究非常多,但主要是從專利法學角度進行的研究,定量分析的研究并不多見,尤其是專利共被引的研究很少,從Web of Science 中僅檢索到3 篇相關論文,CNKI 中僅2 篇與專利共被引相關的論文(檢索時間截至到2012 年8 月20 日)。
關于專利的研究主要集中在如下幾個方面:
。1)專利統計分析專利統計分析是最常見的專利研究方法。包括專利的發明人統計、專利權人統計、專利分類號統計、專利的時序分析等等。
。2)專利引用分析早在1949年,Seildel就首次系統地提出專利引用分析的概念[6]。到了1966年,Seidel的設想被Garfield實現。Garfield仿照他創立的科學引文索引(即SCI數據庫)的理念,利用美國專利商標局(USPTO)建立專利引文索引(patent citation indexing)[7]。1994年,Narin正式提出基于專利引用分析的專利計量學的概念[8]。近年來,國內關于專利引用分析的研究也日漸興盛,例如楊中楷、梁永霞等對專利引用過程中知識活動的研究[9, 10],向希堯、蔡虹基于專利引用對技術溢出的分析[11]。
。3)專利共被引分析目前關于專利共被引的研究并不多見。主要有:Mogee等對禮來大藥廠的專利進行共被引聚類分析來識別禮來藥廠的主要技術前沿[12];Kuei-Kuei Lai利用專利共被引分析試圖建立新的專利分類系統[13];國內方面,邱均平等對有機電激發光技術領域的69項高被引專利的共被引分析[14]、以及基于專利權人共被引分析對皮膚洗護類專利進行了研究[4];王賢文基于專利共被引方法對世界500強中的工業企業的大型專利共被引網絡分析[5]。
。4) 專利內容圖分析上述的統計、引用、共被引分析主要來自于科學計量學領域,而專利內容圖分析主要是利用信息科學中的數據挖掘技術,深入到專利內容的文本內部。這方面包括Thomson Reuters公司Aureka 的專利地圖功能、Derwent Analytics 的文本聚類分析功能、亞利桑那大學Hsinchun Chen 開發的基于SOM 算法的專利內容地圖分析[15],以及通過對文獻關鍵詞聚類建立語義網絡來探測新興技術[16]。
整體看來,目前專利計量學在研究方法上以數量統計分析為主,關于引用、共被引的分析方法仍不多見,少數有關專利共被引的研究也只是涉及到某一領域的企業和專利。從未來的發展趨勢來看,專利計量研究將更多地融入科學計量學中的引用分析、共被引分析,信息科學中的可視化技術、文本/數據挖掘方法,從而使得研究者們更多地深入專利數據的內部實質,更好地把握技術競爭結構,開展技術競爭情報研究。
1.2 專利計量在企業技術競爭情報研究中的應用
專利計量方法是技術競爭情報研究的一種主要手段。例如Breitzman等基于專利引用分析對企業的合并、收購進行技術競爭情報分析[3];王賢文基于專利共被引方法對世界500強中的工業企業的技術競爭分析[5];邱均平、羅力等基于專利權人共被引對皮膚洗護類企業技術競爭情報進行了實證研究[4];孫濤濤、金碧輝基于專利文獻耦合和專利引用關系挖掘DVD激光頭技術中的關鍵技術,研究企業技術競爭情報[17];王興旺、孫濟慶研究了專利地圖與技術競爭分析之間的深層次聯系,提出基于專利地圖的技術競爭三維分析法[18]。
這些文獻對企業技術競爭情報分析具有重要價值,有些還具有開創性的意義。然而,這些研究在研究對象的選擇上都是側重于分析某個企業、領域、行業,很少從宏觀整體的角度來研究眾多企業所形成的技術競爭結構。這其中的一個關鍵原因就是這些研究均是從專利的后向引用角度來進行分析。如果要對不同技術領域之間的專利進行共被引分析,例如本文選擇的500強企業涉及到51個行業,從后向引用的角度則無法實現為數眾多的企業共被引網絡的構建。
2 數據與方法
2.1 數據
2.1.1 專利數據庫
本文的專利數據來自于德溫特創新索引(Derwent Innovation Index)。該專利數據庫是以德溫特世界專利索引(Derwent World Patent Index)和德溫特世界專利引文索引(PatentsCitation Index)為基礎形成的專利信息和專利引文信息數據庫,于1948年在英國創建,是Thomson Reuters集團除了Web of Science之外的另一重要產品,目前是世界上最大的專利文獻數據庫,總計收錄了19,204,885條專利數據(查詢時間:2012年6月16日),并且還在以每周增加數萬條的速度不斷更新!
2.1.2 樣本選擇世界
500強(Global 500)是《財富》雜志(Fortune)按照營業收入評選出的世界上500家最大的公司,每年評選一次。該榜單對評選出的500家企業分成了49個行業領域,其中企業分布數量最多的行業分別是煉油41家、商業銀行41家、車輛與零部件29家、電信18家、金屬18家。
通過從德溫特創新專利引文索引數據庫中分別檢索這些企業的專利發表數量,最后選擇專利發表數量大于100 的前232 家企業,作為本文的研究樣本。這些企業的行業分布如表1所示。
2.1.3 基于專利前向引用的全域共被引矩陣構造方法
根據 Web of Science 的解釋,前向引用(forward citation)關系為某篇文獻被哪些新的文獻所引用,后向引用關系則為某篇文獻引用哪些更早時期的文獻。
以往的共被引分析都是針對后向引用關系來構建共被引矩陣。這種方法類似于社會網絡分析中的雪球方法(Snowball Methods),從一個或者一組頂點開始,搜尋其他與之關聯的頂點,然后構造出一個網絡[20]。例如檢索甲骨文公司,得到2542 條專利,通過對這些專利的1 萬余條引用專利進行分析,構建出共被引矩陣。這種共被引關系可以稱為局域共被引關系(Local Co-citation)。但是由于從原始數據中獲得初始頂點的有限性,通過這種后向引文關系得到的共被引矩陣存在局限性。如果我們要研究汽車企業和電子、化工企業之間的專利共被引關系,利用后向引用關系則很難實現。
而通過專利的前向引用關系,可以構建出大型的專利共被引網絡。類似于社會網絡分析中的全網絡方法(Full Network Methods)[19],即首先確定所有的頂點(企業),然后搜尋每一個頂點與其他頂點的所有關系(專利共被引關系),這種共被引關系為全域共被引關系(Global Co-citation)。但是這種方法的缺點是必須要處理海量的數據信息。因為一個企業的專利可能被成百上千的其他企業所引用,如果要分析多個企業之間的專利共被引關系(例如本文中的232 家500 強企業),涉及到的專利數量則數以千萬計。
如所示,a0 為企業a 的發表專利集合,a1 為a0 的引用專利集合(后向引用),a2為引用a0 的專利集合(前向引用);b2 為b0 的前向引用專利集合。通過對a2 和b2 取交集運算,得到企業a、b 的專利共被引次數。同理,對任意兩家企業的前向引用專利集合進行交集運算,最終構造出全部232 家企業的專利共被引矩陣。
表2列出了部分企業的專利共被引矩陣,檢索時間段設定為2000-2012年。對角線上的數值為企業的專利總被引次數,其余數值為兩家企業的專利共被引次數。專利被引次數最多的企業為日立公司,總被引264637次,它與東芝公司的專利共被引次數為65965次,與IBM的專利共被引次數為65965次。
2.2 方法
2.2.1 共被引系數矩陣由于不同企業發表的專利數量差別很大,例如汽車行業的豐田、福特;電子電器行業的索尼、松下、飛利浦歷年發表的專利數量都數十萬計。而信息技術的甲骨文、埃森哲歷年發表的專利只有幾千條。所以必須對原始的共被引次數矩陣進行標準化處理,即創建共被引系數矩陣。常見的計算共被引系數矩陣的方法有Jaccard系數、Cosine系數等,但是Van Eck與Waltman 認為關聯強度(association strength)指標比Jaccard和Cosine更適合用來進行聚類分布的分析[20]。本文在此采用關聯強度的計算方法將表2中的共被引次數矩陣轉換成共被引系數矩陣,如下式所示:
2.2.2 專利地圖構造類似于多維尺度分析(multidimensional scaling),在這一步驟中,將企業按照相似性矩陣中的相似性距離關系反映到二維平面中。企業i和企業j在地圖中的距離是根據二者之間的相似度sij來計算的。兩家企業的相似度越大,在地圖中的距離則越小。
3 結果
3.1 基于相似性矩陣的企業聚類分布作者在此采用荷蘭萊頓大學科學與技術研究中心(Centre for Science and TechnologyStudies,Leiden University)開發的VOSviewer 對232 家世界500 強企業進行可視化分析[20]。VOSviewer 與其余軟件的多維尺度分析分析(例如SPSS、Ucinet、Pajek)所不同的是,為了避免樣本數量太多造成點和標簽的重疊,它在構圖的時候開發出獨特的去除重疊標簽和層級顯示技術,突出顯示最重要節點的標簽,如圖2 所示。圖中的232 個節點代表了232 家企業,節點的大小反映了該企業的被引次數,例如被引次數最高的企業日立公司(被引264637 次),其節點尺寸也是最大的。兩節點之間的距離反映了兩企業的共被引關聯強度,例如左上角豐田汽車、日產汽車、通用汽車之間的距離非常小。由于VOSviewer 在構圖上的去除重疊標簽和層級顯示技術,有部分節點的標簽顯示得比較淡或者沒有顯示,而那些最為重要的節點則得到突出顯示。節點的不同顏色是按照Fortune 500 給每個企業的行業歸類來劃分的。39 種顏色代表了這232 家企業分屬的39 種行業。 VOSviewer 中對全部232 家企業進行聚類。首先選擇程序默認的Resolution 等于1.0,得到6 個聚類。如圖3 所示。
進而選擇 Resolution 等于2.0,得到24 個聚類,比較圖4 與圖3 可以發現,最明顯的差異有兩處:(1)圖3 中右上方較大的節點都被劃分成獨立的聚類。例如三菱電機與日立、東芝、松下本來都屬于電子電器行業,但是在圖4 中它們被劃分成許多分散的聚類。(2)圖3 左下角的大聚類被重新劃分為3 個小聚類,分別是最下邊的杜邦、拜耳、默克、雅培等組成的化工制藥聚類;化工制藥聚類右上方由聯合技術、波音、通用電氣、霍尼韋爾等組成的航空國防聚類;以及其他零散企業組成的綜合聚類。
如果進一步提高Resolution 值,會對被引次數較小的那些企業進行更為準確的聚類。傳統的聚類分析都是通過樹狀圖和龍骨圖對樣本進行聚類,如果樣本過多的話(例如本文中的232 個樣本),則需要很大的構圖空間。而VOSviewer 創造性地將多維尺度分析與聚類分析結合起來,既大大節省了構圖空間,又可以更加清晰直觀地對聚類與聚類之間、樣本與樣本之間的關系進行判斷。
從對 232 家世界500 強企業的聚類分布結果來看,電子電器、汽車、化工制藥、航空國防、信息技術是最為突出的技術群。從聚類之間的位置來看,航空國防對電子電器技術和汽車技術都起了很重要的橋接作用。
3.2 基于 Kernel 密度插值分布
的技術競爭整體結構分析在圖 4 的聚類分布的基礎上,進一步對232 家企業進行Kernel 密度函數插值分析,從而更好地了解企業技術競爭的整體結構。
圖為對232 家企業的專利共被引矩陣的Kernel 插值分布結果。圖中紅色區域代表企業分布密度最大,藍色區域則代表企業分布稀疏。圖4 中的企業的位置分布與圖2、圖3 完全一致,但是根據圖4 的Kernel 密度函數插值分布,可以看到這223 家企業形成的技術競爭結構,其中以東芝、日立、NEC、富士通、IBM 等企業為代表的電子電器、信息技術是分布密度最大的區域。其次以豐田為代表的汽車技術領域,杜邦為代表的化工技術領域也比較顯著。按照Nees Jan van Eck 與 Ludo Waltman 對VOSviewer 軟件的解釋,分布在這些紅色區域中的企業整體上的專利被引次數也是相對最高的。
3.3 基于共被引網絡的關鍵企業分析
在利用社會網絡工具繪制共被引網絡的時候,Leydesdorff 認為,Jaccard 系數更適合計算共被引強度矩陣[21]。因此,作者在此處采用Jaccard 系數方法將表2 中的共被引次數矩陣轉換成共被引系數矩陣,再進一步利用社會網絡分析工具Netdraw 進行分析。
設定閾值為0.03,網絡中一共保留有132 個節點和1230 條連線,節點的大小是根據節點在網絡中的中介中心性(betweenness centrality)大小計算出來的,節點連接不同聚類的連線越多,其中介中心性越大,因此中介中心性很好地體現了節點連接不同技術群聚類的關鍵性作用。圖5 的共被引網絡也呈現出清晰的技術聚類結構,例如由默克、輝瑞、百時美施貴寶、諾華、葛蘭素史克、禮來等形成的制藥產業技術群;由杜邦、陶氏、巴斯夫、拜耳形成的化工產業技術群;由福特、通用、大眾、馬自達等形成的汽車產業技術群;以及最中心的由索尼、東芝、西門子、日立、三星電子等形成的電子電器產業技術群等等。
然而,最關鍵的是,通過圖5 的共被引網絡,可以挖掘出使不同技術群產生聯系的關鍵企業。例如,汽車產業技術群與電子電器產業技術群、化工產業技術群與電子電器產業技術群都是通過通用電氣公司產生聯系;而數據庫巨擘甲骨文公司則使銀行產業技術群與中央的主網絡產生聯系。我們在圖6 中用虛線環標記了若干關鍵性企業,包括通用電氣公司、杜邦化學、IBM、甲骨文、亞馬遜網站等等。
而這些企業之所以成為關鍵性企業的原因,有如下兩點:(1)該企業的核心技術具有多元化發展的特征,例如通用電氣公司包括11 個業務集團,除了生產消費電器、工業電器設備外,還涉足武器制造、宇宙航空儀表、噴氣飛機引航導航系統、多彈頭彈道導彈系統、雷達和宇宙飛行系統等。(2)該企業的核心技術具有較強的基礎性。例如甲骨文公司的數據庫產品在金融服務業領域的廣泛應用。
4 結論
本文通過從專利的前向引用關系構建出世界500 強企業的專利共被引矩陣,從而使得對眾多不同行業的專利共被引研究成為可能。結合社會網絡分析及信息可視化技術,本文對專利數量大于100 的232 家世界500 強企業進行技術競爭地圖的實證研究,研究技術群的聚類分布、技術競爭的整體結構,以及挖掘技術競爭網絡中的關鍵性企業。電子電器產業作為專利發表強度最突出的行業領域,在技術整體競爭中發揮了非常重要的作用。航空國防產業則在電子電器與汽車產業之間形成了重要的橋接作用。通過共被引網絡挖掘出中介中心性最大的關鍵性企業,例如通用電氣、IBM、甲骨文,其在不同產業之間的技術橋梁作用也非常重要。
[參考文獻]
[1] 李睿,孟連生. 論專利引用行為與期刊論文引用行為在揭示知識關聯方面的差異[J]. 情報學報,2012,29(3): 474-478.
[2] 李艷,趙新力,齊中英. 技術競爭情報的現狀分析[J]. 情報學報, 2006,25(2): 242-253.
[3] Breitzman A, Thomas P, Cheney M. Technological powerhouse or diluted competence: techniques forassessing mergers via patent analysis[J]. R & D Management, 2002,32(1): 1-10.
[4] 邱均平,羅力,蘇金燕, 等. 基于專利權人共被引的企業技術創新態勢研究[J]. 情報科學, 2012,(2):161-165.
[5] 王賢文,劉則淵,侯海燕. 基于專利共被引的企業技術發展與技術競爭分析:以世界500 強中的工業企業為例[J]. 科研管理, 2012,31(4): 127-138.
[6] Seidel A. Citation system for patent office[J]. Journal of the Patent Office Society, 1949,31: 554-567.
[7] Garfield E. Patent Citation Indexing and the Notions of Novelty, Similarity, and Relevance[J]. Journal ofChemical Documentation, 1966,6(2): 63-65.
[8] Narin F. Patent bibliometrics[J]. Scientometrics, 1994,30(1): 147-155.
[9] 楊中楷,梁永霞, 劉則淵. USPTO 中我國專利引用狀況的統計分析[J]. 圖書情報工作, 2012,(02): 42-46.
[10] 楊中楷,梁永霞,劉倩楠. 專利引用過程中的知識活動探析[J]. 科研管理, 2012,(02): 171-177.
[11] 向希堯,蔡虹. 跨國技術溢出網絡結構分析與路徑識別——基于專利引用的實證分析[J]. 科學學研究,2012,(09): 1348-1354.
[12] Mogee ME. Patent co-citation analysis of Eli Lilly & Co. patents[J]. Research-Technology Management,1991,34(4): 43-49.
[13] Lai KK, Chang SM, Chang SB. Using patent citation to explore knowledge flow between differentindustries[M], 2007.
[14] 邱均平,馬瑞敏,徐蓓, 等. 專利計量的概念、指標及實證——以全球有機電激發光技術相關專利為例[J]. 情報學報, 2012,27(4): 556-565.
[15] Li X, Lin Y, Chen H, et al. Worldwide nanotechnology development: a comparative study of USPTO, EPO,and JPO patents (1976-2004)[J]. Journal of Nanoparticle Research, 2007,9(6): 977-1002.
[16] Kim Y, Suh J, Park S. Visualization of patent analysis for emerging technology[J]. Expert Systems withApplications, 2012,34(3): 1804-1812.
[17] 孫濤濤,金碧輝. 關鍵技術挖掘與企業技術競爭情報——以 DVD 激光頭技術為例[J]. 圖書情報工作,2012,52(5): 129-132.
[18] 王興旺,孫濟慶. 專利地圖在技術競爭分析中的應用研究[J]. 圖書情報工作, 2012,53(12): 79-82.
[19] Hanneman R, Riddle M. Introduction to social network methods[EB/OL].
[20] Van Eck NJ, Waltman L. Software survey: VOSviewer, a computer program for bibliometric mapping[J].Scientometrics, 2012, 84:523–538.
[21] Leydesdorff L. On the normalization and visualization of author co-citation data: Salton's cosine versus theJaccard index[J]. Journal of the American Society for Information Science and Technology. 2012, 59(1):77-85.
【基于專利共被引的世界500強企業技術競爭的專利地圖分析】相關文章:
中國企業500強與世界500強的比較12-07
企業專利資本化戰略12-07
基于企業生態位理論的企業競爭策略研究03-19
企業專利申請戰略的運用探討03-23
高新技術企業基于價值鏈的競爭戰略分03-01
基于技術跨越的企業技術學習探討03-22
探討世界500強的項目管理03-13
基于價值鏈理論的企業品牌競爭策略03-24