首页
/
每日頭條
/
科技
/
知識圖譜應用解讀
知識圖譜應用解讀
更新时间:2024-09-30 18:16:04

編輯導語:“無知識圖譜,不AI”,知識圖譜一直是AI領域不可不談的話題,各大公司都在搭建各自領域的知識圖譜,還有許多靠做知識圖譜起家的獨角獸公司。那麼知識圖譜到底是什麼?它為什麼會被大家熱衷?它與傳統的數據庫存儲數據的方式有何不同?讓我們一起看看吧。

知識圖譜應用解讀(初識知識圖譜了解基礎原理)1

一、知識圖譜是什麼?

如字面意思,知識圖譜可以拆解為“知識”和“圖譜”去理解。

知識,是人們在改造世界的實踐中所獲得的認識和經驗的總和。

圖譜,是一種強調鍊接的存儲方式。

知識圖譜其實就是存儲及表達知識的一種方式。

但一個知識的儲存方式為什麼會被單獨提出來?甚至被Google作為一項技術項目單獨提出來?

首先得了解知識在認知中起到的作用。

其實在Google之前,知識圖譜的前身:語義網絡早在1960年代就被提出,當時是作為知識表示的一種方法被提出,主要應用于自然語言理解領域(讓機器能夠理解語言)。

知識圖譜應用解讀(初識知識圖譜了解基礎原理)2

知識圖譜演化的重要節點

正如人去理解一段話所表達的意思時,也用到了知識,比如“阿偉手上拿着剛發布的蘋果”,這句話要能被正确理解,離不開對應的知識,至少得知道蘋果除了是吃的,還可以是個手機牌子。

也就是說知識圖譜起源是為了讓機器更好的理解語言,通過建立起知識庫,這種方法企圖讓機器擁有更多的“知識點”,能進行更多的聯想及推理,對信息的理解更到位。

知識圖譜應用解讀(初識知識圖譜了解基礎原理)3

知識圖譜在人工智能中充當“記憶”的角色

知識的作用不僅限于文本,對圖片也一樣。

解讀出的感受是又油又土十分好笑,這其中也運用了知識聯想,聯想了演員在社交媒體中的人設形象,當前的表情及動作,聯想了發圖者與自己的關系,于是會心一笑。

二、為什麼是圖譜?

為什麼演化到目前階段,是通過圖譜去存儲知識,而不是傳統數據庫?

我認為有兩點:

第一是因為圖譜的存儲結構足夠簡單,圖譜通過“三元組”存儲知識,即頭實體、關系,尾實體組成;

比如:蘋果手機是蘋果公司旗下的産品,抽象成知識表達的三元組即是:

知識圖譜應用解讀(初識知識圖譜了解基礎原理)4

幾乎所有的能通過符号表示的知識都能用這個結構進行儲存。

第二是因為互聯思維的普及,在強調萬物互聯的時代,圖譜這種注重鍊接的存儲方式能串聯不同領域的知識,從而挖掘其中關系隐藏的價值。

三、知識圖譜有什麼用?

目前知識圖譜應用主要有兩個大方向:

1. 輔助語言理解

知識圖譜在輔助語言理解方面起的作用有:

實體消歧:對文中提到的多義詞進行精準判斷,如上文提到的蘋果案例。

指代消解:對文中的代詞做出解釋,如他和它。

其中代表性的應用如下:

(1)搜索

傳統搜索隻提供對網頁的搜索(紅框部分),圖譜提供了對事物本身的描述,讓結果更直觀,更符合查詢的語義。

知識圖譜應用解讀(初識知識圖譜了解基礎原理)5

圖譜搜索效果展示

(2)問答

垂直領域的問答系統會涉及到許多專業知識面的問題,舉個保險行業的例子:

比如當客戶問到:“xx保險能不能保障脊髓灰質炎?”

知識圖譜可以通過結合保險領域知識與醫療知識進行推理,從而給出精準答案。

知識圖譜應用解讀(初識知識圖譜了解基礎原理)6

知識推理簡化示意圖

2. 輔助大數據分析

圖譜可以結合各類領域的知識,打造領域型的知識圖譜,目前在大數據分析方面,工業落地主要應用如下:

(1)推薦

知識圖譜中包含了豐富的關聯性,可以為推薦系統提供部分信息來源;比如常見的推薦有電影推薦、音樂推薦。

加入圖譜推薦的好處主要是可解釋性強,能基于設定好的推薦路徑進行精準推送。

比如小丁喜歡聽《艾米莉》,《艾米莉》的樂隊是回春丹,那麼同個樂隊的歌可以作為推薦。

知識圖譜應用解讀(初識知識圖譜了解基礎原理)7

(2)風控

圖結構能非常好的與SNA(社交網絡分析)理論相結合,對團夥欺詐這類型的風險能起到非常好的挖掘作用;如洗錢行為可以綜合多筆交易、企業信息等看是否出現資金彙集等。

圖的優勢在于能跨多度計算,能挖出埋藏較深度的風險關系,比起傳統的偵察手段對團夥作案的風險能摸查得更全面。

三、無圖譜,不AI?

這句話在現階段,大家當pr稿理解就好了,事實上很多的AI落地應用,并沒有用到知識圖譜,知識圖譜本身也存在着相當多的局限。

1. 工業落地視角

至少在目前階段,許多項目中知識圖譜的平替方案有很多,比如風控場景,通過傳統的數據分析也能抓出許多問題案件;問答場景,搭建簡單的問答知識庫比直接建立知識圖譜效率更高,投入更小。

究其原因還是在于這項技術需要非常大的資源投入,需要大量的具有豐富業務知識的專家,圖算法專家等。

實際的工業落地項目中,幾乎有70%的時間投入在圖譜數據的獲取、清洗、結構化上,而像知識框架的建設、圖應用隻占了不到30%的時間。

2. 技術視角

上文提到,知識圖譜的三元組形式能表示幾乎所有的符号型知識,即能被很好表達的顯性知識,但現實中存在着很多知識是隐性的,比如一項技能,彈鋼琴光知道樂理但沒有熟練的指法也不行。

且知識圖譜對于數據的結構化程度要求十分之高,但現實中大部分業務數據是非結構化的,如何将非結構化數據轉為結構化,而這是一道還沒有被解決的業界難題,是NLP的瓶頸。

四、結語

對每項新技術,我們應看到技術未來的發展空間,同時也要看到技術在當下的局限性。

保持對技術的理解、思考與反思,才能将技術真正落地。

本文由 @産品哲思 原創發布于人人都是産品經理。未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
關于minecraft信息
關于minecraft信息
《我的世界》已經鞏固了其作為少數幾個在其最初發布十年後用戶繼續增長的遊戲之一的地位。雖然大多數視頻遊戲的保質期不到兩年,但MojangStudios似乎能夠一次又一次地吸引遊戲玩家回來。Minecraft由曾為King工作的遊戲開發者Mar...
2024-09-30
服務器有啥作用和功能
服務器有啥作用和功能
衆所周知,機房是服務器托管商的重要資源,選擇一家靠譜的服務器托管商就必須要對IDC其機房進行考察和參觀,今天與大家一起認識下機房必備的服務器保障要求,讓大家在進行機房考察時,知道哪些才是機房的重點。一、服務器的定義和作用如下:1、服務器是一...
2024-09-30
網絡信息安全和網絡安全有區别嗎
網絡信息安全和網絡安全有區别嗎
2021年兩會在社會各界的矚目下順利閉幕,十四五規劃與2035年遠景目标把發展與安全列為綱要,一切的國民社會經濟發展的前提之下,建立完善的安全體系,堅持總體國家安全觀。在《規劃綱要》中,“三新發展”即“新階段、新理念、新格局”貫穿全文,其中...
2024-09-30
安裝3dsMax軟件遇到的常見問題以及解決方法
安裝3dsMax軟件遇到的常見問題以及解決方法
在平時學員在安裝軟件時,經常遇到的問題及解決方法彙總整理,供廣大學員收藏使用一、安裝低版本軟件時,尤其是3dmax2012、3dmax2013版本時,經常會遇到下面這種問題解決方法如下把3dMax安裝包裡面的3rdParty\\x64\VC...
2024-09-30
電腦死機鍵盤不動怎麼重啟
電腦死機鍵盤不動怎麼重啟
一台電腦開始使用了幾個月均正常,但有一天發現電腦啟動不正常,開機後顯示器沒有顯示,電源指示燈亮。根據故障現象分析此故障,應該是硬件故障引起的原因造成此故障的原因,主要有以下幾個方面的問題:(1)CPU有問題。(2)主闆有問題。(3)内存有問...
2024-09-30
Copyright 2023-2024 - www.tftnews.com All Rights Reserved