生成式AI的簡介與應用

生成式AI的簡介與應用

生成式AI的簡介與應用

生成式AI是人工智慧技術中一個重要的分支,現已廣泛應用於各行各業,無論是在智能客服、內容創作,或者資料分析中,其都扮演了日益重要的角色;然而,隨著生成式AI的普及,相應的挑戰與危機也浮上檯面。本文將帶您瞭解生成式AI的基本概念及其背後的大語言模型技術,並分析其在發展過程中面臨的痛點與挑戰,最後透過實際案例,展示生成式AI在不同領域中如何實現高效應用。

生成式AI與人工智慧技術簡介

生成式AI是一種人工智慧技術,主要特點是能夠生成新的內容,例如文字、圖像或音訊,不僅限於對現有資料進行分類或預測,還能夠用於解決問題或滿足多樣的需求。而人工智慧技術有很多種類型,常見的包含監督式學習、非監督式學習、增強式學習等,三者處理、學習數據的方式如下:
  1. 監督式學習:我們告訴模型一些範例資料和答案,模型學到資料和答案之間具有鑑別力的特徵後,就可以依樣畫葫蘆去進行分類或預測。
  2. 非監督式學習:給模型一批資料但不告訴它答案,讓模型自己找到資料當中重要的特徵進行分群。
  3. 增強式學習:不給模型訓練資料,但告訴它目標及獎勵機制是什麼(怎麼做會得分、怎麼做會扣分),讓模型自行嘗試找出達到高分的方法。
生成式AI則強調用更大量的資料,在沒有明確標籤或指導下,學習這些資料的分佈,生成更多類似的資料。

生成式AI背後的技術原理:大語言模型

生成式AI所依靠的其中一個技術便是「大型語言模型」(Large Language Model, LLM),其特色在於訓練過程中,模型可以自大量資料中自行學習和理解每個詞、每個句子之間的關係與背後的意義,最後根據指令,提供符合邏輯的自然語言回應。好比文字接龍,參與者需要根據已知的詞語來生成符合規則的新詞語,大型語言模型在接收問題後,會基於訓練數據和上下文,來評估問題背後最高機率會出現的字詞是什麼,然後一字一字生成出來,最終形成完整且符合邏輯的回答。

而相較於傳統的自然語言處理技術,大型語言模型的優勢有三:
  1. 上下文理解:大型語言模型能更好地理解和處理文意,生成的回應更連貫且有邏輯。
  2. 多任務適用:大型語言模型能夠應付多種自然語言處理的任務,不需要單獨為每種任務來設計特定模型,也因此應用更多更廣。
  3. 大規模資料:大型語言模型用以訓練的文本資料通常十分龐大,可能是幾千萬甚至幾億的語料,讓模型能夠掌握豐富的知識,做出更準確的理解與回覆。
這些特點使得大型語言模型在生成式AI中的應用廣泛而有效,例如智能客服、文案生成創作、資料自動化解讀分析等等,皆是藉由大型語言模型來達成作業自動化,並提高工作效率。

生成式AI的痛點、挑戰與解方

不過,從2023年劍橋字典選出的年度代表字:Hallucination,幻想,其實就反應了AI的可信賴性是一大挑戰,因為生成式AI對於沒看過的資訊會想辦法拼湊出答案。模型生成的內容可能表面上看起來合理,實際上卻缺乏真實的參考來源,這種現象在回答專業知識問題時更為明顯,因為模型可能傾向根據在訓練數據中學到的資料來生成答案,而非真正理解問題及實際參考文章來進行答覆。

面對上述問題,檢索增強生成(Retrieval-Augmented Generation, RAG)技術是一個良好的解決方案。RAG是2020年由Patrick Lewis提出,其結合了檢索和生成式AI的優勢,首先檢索外部資料庫中的相關資訊,再基於這些資訊生成回答,藉此減少憑空杜撰的可能性、增強回覆的相關性和真實性,進一步提升問答效果,確保符合實際應用需求。

▲檢索增強生成技術(Lewis, P., 2020)

除了RAG, 2022年1月Google研究員Jason Wei提出的思維鏈(Chain-of-Thought, CoT)概念,則是在大型語言模型的輸入中,加入額外的例子和描述作為上下文,以此幫助模型在進行任務時引入更多的思考過程,並引導模型進行更深入的推理,透過預測「思維過程」來提高模型的性能,讓大型語言模型能夠更好地理解並回答複雜的問題。

▲思維鏈(Wei, J., 2022)

生成式AI的應用實例

檢索增強生成技術與思維鏈的概念提升了生成式AI的性能,也拓展了大型語言模型在多個領域的應用範疇。下文將著重說明大型語言模型如何應用於「政策評估」:
  1. 透過大型語言模型對文本進行摘要,找出重點

在進行政策評估時,會需要針對如會議記錄、訪談內容、問卷中的開放式問題或網路輿情等資料進行質性分析,以歸納出多元利害關係人的相關意見或質疑。此時,結合自然語言處理(Natural Language Processing, NLP)技術與大型語言模型(Large Language Model, LLM),便能夠讓分析更有效率,避免過去逐篇檢視文本後才能找出重點的耗時過程。

首先,為瞭解民眾對於議題有哪些重要的意見面向,可藉由AI語意模型對民眾言論文本進行「重要關鍵字提取」與「語意相似度計算」,並輔以分群演算法將相似討論進行歸類,拆解出不同的討論面向,作為政策評估時的參考。下圖是「晚婚 / 不婚議題」在社群討論當中的分群結果,圓圈大小代表討論的顯著(集中)程度,而圓圈彼此之間的距離則代表討論的相似程度。

▲「晚婚 / 不婚議題」社群討論分群結果
根據分群結果,再透過其他來源如相關文獻或訪談內容,進一步辨識出可進行分析研究的意見,接著提取重點關鍵字、並以布林邏輯篩選資料,統計關鍵字的出現頻率。完成各個討論面向的資料篩選後,藉由以大型語言模型(LLM)為基礎的生成式AI進行解讀與分析,自原始留言、發文內容中歸納出白話的討論面向與重點摘要。下表是以晚婚不婚議題經過辨識後,其中兩個討論面向的摘要內容:
▲「晚婚 / 不婚議題」討論面向摘要
  1. RAG:搜尋引擎結合大型語言模型,提升研究效率

針對政策評估時所蒐集的大量質性資料,過去往往需要花費大量時間解讀,才能從中找出關鍵課題。透過檢索增強生成(Retrieval-Augmented Generation, RAG)技術,將搜尋引擎與生成式AI優勢相融合,便能快速將文本資料中的重點知識內容,轉化成淺顯易懂的重點說明。

首先,搜尋引擎能夠直接對多種格式的文件進行文本上的解析,在搜尋時也能夠進行跨檔案的比對;生成式AI演算法則可以探索和分析複雜的資料。在針對某個議題、概念進行研究時,「搜尋引擎 + 生成式AI」能夠即時從龐大的資料庫中搜尋相關命中段落,並將這些內容快速摘要呈現;透過理解語言的結構和語境,也能確保命中段落的展示是精確且相關的。

簡言之,RAG是在檢索讀取(Retrieve-Read)的框架下進行搜尋(Yunfan, G. ,et al, 2023),能夠識別並找尋給定的相關資訊需求(Zhao, P. , et al, 2024),基於對命中段落的理解,使生成式AI能夠進一步生成摘要,協助使用者在短時間內獲得專業且易理解的回覆,避免在研究、搜集過程中浪費時間在無關或不確切的資訊上。例如,面對大量的訪談逐字稿文件,透過RAG技術進行知識搜尋與知識問答,分析者不僅能彙整並凸顯資料中的重要發現,還能驗證對特定解釋的認知是否正確。此外,它也提供了深入洞察,如識別特定發言者在資料中的關鍵觀點,或對比不同發言者對同議題的立場。

下圖呈現RAG技術如何在資料中發現重點,針對公正轉型研討會講座文字記錄文件進行提問,試問「女性在公正轉型中會受到什麼影響」,RAG迅速對該文件進行搜索,並以條列式回覆重點摘要,同時將參考段落的位置標示出來。

▲以RAG技術彙整資料重點;意藍「AI Search for KM新一代生成式AI知識管理系統」問答畫面
下圖則是詢問某發言者在會議中的發言重點,RAG能夠快速歸納文件中的相關內容,亦標記參考段落之位置,方便搜尋者在文件中找到關鍵資訊。
▲以RAG技術歸納發言者發言重點;意藍「AI Search for KM新一代生成式AI知識管理系統」問答畫面
生成式AI技術的運用,使得從龐大資料中提取有價值的訊息變得更加高效和精確,從而增強了循證決策的整體效能。
本文引用、改寫自【循證決策協作平台】上112年度計畫團隊技術組之文章,歡迎前往閱讀原文:
企業如何推動知識管理?4步驟讓知識動起來

企業如何推動知識管理?4步驟讓知識動起來

企業如何推動知識管理?
4步驟讓知識動起來

隨著市場上的競爭日益激烈,如何有效推動知識管理成為了企業提升競爭力的關鍵;然而,許多企業在推動知識管理的初期,常常不知如何起步。知識管理不僅涉及知識的識別、儲存,更包括如何系統性地分享和應用這些知識,本文將介紹知識管理的基本概念,並說明可以從哪些面向著手建立和推動知識管理體系,最後深入探討生成式AI如何為知識管理領域帶來革新。

知識管理概念介紹

知識管理是什麼?
知識管理(Knowledge Management, KM)是指在企業或組織內部,對知識進行系統性的蒐集、保存、組織、分享和應用的過程,將分散在個人、團隊和系統中的知識轉化為整個組織可以利用的資產,進而提升組織的營運能量和整體競爭力。
知識管理如何提升企業競爭力?
知識管理可以透過以下多種面向提高企業競爭力:
  1. 改善營運效率:藉由知識管理,員工可以分享和存取企業或組織內部的資訊,在遇到問題時,也能通過知識庫或企業內部的知識分享平台迅速找到解決方案,避免重新投入時間和資源去解決過去發生過的問題,進而提升生產力與整體營運效率。
  2. 加速創新能力:企業可以透過知識管理,從現有技術和過往經驗中持續學習,並不斷進行優化,加速產品的創新及發展進程。
  3. 提高決策品質:知識管理促進了既有知識與資源的整合,使企業能夠記錄和分析過去的決策及其結果,藉此更準確地預測市場風險和潛在挑戰,加速決策過程並提升決策精準度。
  4. 經驗傳承:知識管理有助於經驗的傳承,除了避免人員重複學習和研究,也可以減少因員工離職或崗位變動造成的知識流失。

企業推動知識管理4步驟

從零開始推動知識管理是一個需要循序漸進的系統化過程,涉及多個層面的協同與整合,而企業可以從以下四個步驟著手:
  1. 知識需求分析:分析企業內部的知識需求,確定哪些知識對企業的運營和發展至關重要,並識別現有知識資源和潛在的知識缺口;同時盤點目前的知識管理狀況,包括知識儲存方式、知識共享文化以及技術基礎設施等,找出需要改進的領域。
  2. 整合發展目標並制定策略:根據需求分析的結果,制定詳細的知識管理計劃,包括如何蒐集、存儲、分享和應用知識,並設定具體的里程碑,將知識管理融入企業發展策略中。
  3. 營造知識分享文化:持續宣導知識分享對於個人和企業長期發展的重要性,除了高層人員以身作則外,也通過培訓、激勵措施或知識管理競賽等,鼓勵員工主動分享經驗與知識,抑或讓知識物件的經營成為員工績效評估的加分專案。
  4. 導入適當技術:結合生成式AI人工智慧技術,對企業內外部知識進行系統性盤點,建構一站式資訊平台,實現 AI 輔助的知識檢索與問答,提供知識的分享、學習、再運用與創新,包括知識地圖、專家黃頁、知識社群、結構化在職訓練及問答等。
而若是原先就有既有知識庫的企業,則可以透過以下方式優化並提升知識運用效率:
  1. 評估現有知識庫:全面審視企業內部的知識庫,包括其結構、格式、內容及涵蓋範圍,識別關鍵知識,以及和潛在需要補強的地方。
  2. 導入新一代生成式AI知識管理系統:對現有知識庫與生成式AI知識管理系統進行整合,並利用AI的自然語言處理能力,提升知識檢索的準確性以及效率。
  3. 即時更新與動態適應:建立即時更新機制,確保知識庫中的內容能即時、動態調整,以快速反映業務需求和市場變化。
  4. 加強處理非結構化資料:透過語意分析技術,將非結構化資料轉換為結構化資料,並結合生成式AI技術,利用其自然語言理解和生成能力,自動化處理大量非結構化資訊,將其轉化為可檢索和使用的知識,提高知識庫的全面性和實用性。

生成式AI對知識管理的影響

隨著生成式AI技術的發展,其為知識管理領域帶來了重要的革新。在技術層面上,它讓知識的檢索變得更為彈性;在應用層面上,則讓使用者能更有效且快速地吸收相關知識。
技術面的影響:搜尋檢索更彈性,更容易學習上手
傳統的知識檢索方式主要仰賴關鍵字檢索與預設的分類樹結構,而這樣的檢索方式存在兩個痛點:
  1. 對於使用者來說,較難將問題轉換成複雜的關鍵字組合進行提問,也因此使用門檻較高。
  2. 關鍵字的檢索多是以「關鍵字組合的出現次數」作為搜尋依據,無法反映出問題與參考文本間的語意關係,造成檢索結果可能與用戶期望有所偏差。
將生成式AI導入知識管理領域後,應用其「自然語言對話」的特性,可以有效解決上述兩個痛點:
  1. 生成式AI允許使用者以自然語句直接輸入問題進行提問,用戶無須把問題轉換成複雜的關鍵字組合,降低了使用門檻。
  2. 生成式AI能夠更好地理解問題的語意,使搜尋結果能夠更準確地反映問題的內容,並找到與問題真正相關的參考文本。此外,生成式AI可以生成淺顯易懂的答案,直接解決使用者的問題。
導入及使用上的影響:更有效的知識吸收與消化

傳統的知識管理,在導入及使用上往往停留在「檔案」層級,使用者須透過關鍵字檢索找到最可能的檔案後,自行閱讀數十甚至上百頁的內容,從中找出與問題相關的資訊,再進一步消化以解答問題;而這樣的架構將使得用戶無法「快速且有效」地吸收、消化知識。

引入生成式AI技術後,這一問題則能得到顯著改善。生成式AI將知識管理提升到「答案」層級,利用AI的語意理解及自然語言問答能力,讓使用者可以直接獲取系統所參考的資料庫中相關檔案的段落,並生成白話回答,協助使用者高效達成知識消化及吸收的目標。

企業導入AI Search for KM之優勢

意藍的AI Search for KM即是整合生成式 AI、高速搜尋引擎與 NLP 技術的新一代生成式 AI 知識管理系統,其所具備的功能特色如下:
  1. 支援多種檔案格式:AI Search for KM系統支援各種常見的檔案格式,包含常用的Office、PDF、文字檔等等,滿足企業需求。
  2. 權限控管機制:確保使用者僅能查詢到自己有權限查看的檔案與文件,避免資料洩露,滿足企業管控機敏資訊、劃分部門權限等需求。
  3. 全文檢索:系統不僅能夠檢索檔案的標題和內文,也能查詢作者及其他相關資訊,提供廣泛且彈性的資料檢索範圍,提升使用者找到所需資訊的效率。
  4. 支援對話問答:AI Search for KM支援使用者以對話問答方式與系統互動,並會根據問題和參考資料提供口語化的回答,幫助使用者輕鬆理解和應用所得知識。
  5. 支援地端或雲端服務:企業可以根據自身需求選擇最合適的部署方式,導入雲端或是地端服務,並可根據不同使用情境和文件資料需求切換不同的大型語言模型。
而對於企業而言,導入AI Search for KM具有以下優勢:
  1. 降低人力成本:透過AI Search for KM自動化搜尋和回答的功能,有效減少員工手動處理知識資訊的需求,簡化知識搜尋與管理流程,節省人力成本。
  2. 提升作業效率:因AI Search for KM支援多種格式的檔案管理,使得資訊不再分散,方便員工找到所需資料,並提供即時準確的回答,縮短員工資訊獲取時間。
  3. 增強知識內化與應用:AI Search for KM支援自然語言互動方式,讓員工能以白話文提問,快速獲得所需知識,從而提升消化和應用知識的效率與準確度。
  4. 強化資料安全與隱私:AI Search for KM的權限控管機制,確保只有具備相應權限的人員才能查找和檢視資料,且系統支援地端服務,能有效防範內外資料洩露風險。
  5. 促進知識共享與協作:AI Search for KM可以整合不同來源的資料,讓各部門的員工都能輕鬆提問和搜尋知識,促進團隊合作交流。
推動知識管理對企業的長期發展至關重要,不僅是提升競爭力的核心,更是確保企業持續創新和應對市場變化的基礎。隨著生成式AI技術的引入,知識管理的應用層次也得到了極大提升,透過導入合適的知識管理系統,企業便能更靈活地管理和運用知識資源,從而在競爭激烈的市場中保持領先地位。
想進一步了解「新一代生成式AI知識管理系統(AI Search for KM)」?
行銷公關的智能變革:AI助力品牌戰略轉型升級

行銷公關的智能變革:AI助力品牌戰略轉型升級

行銷公關的智能變革:
AI助力品牌戰略轉型升級

隨著AI人工智慧技術不斷創新突破,各行各業皆迎來前所未有的變革,例如在行銷與公關領域,AI的應用便重塑了品牌解讀市場訊息、與消費者互動的方式,也開拓了企業提升各項決策精準度的可能性。本文將帶您探討AI如何為行銷公關領域注入新動能,並藉由意藍的解決方案實際展示AI技術在應對公關危機、提升廣告投放精準度等方面的具體應用。

應用1:AI輿情應變顧問

在數位媒體蓬勃發展、資訊爆炸的現代,消費者的聲音和反饋對於品牌的影響日益顯著,負面輿論一旦出現,往往會在短時間內發酵,企業需要作出即時、恰當的應對,才能避免自身形象和信譽受損。因此,如何快速掌握輿情、進行公關危機處裡以防止負面影響進一步擴大,便成為品牌形象管理的重要課題。
以往企業會使用社群聆聽(Social Listening)或是媒體監測(Media Monitoring)工具,來了解社群網路或大眾媒體是如何提及、討論企業自身形象,這類工具蒐集處理了大量的輿情數據,且通常配合搜尋引擎及語意分析技術,協助使用者過濾出有用的資訊。而隨著AI 技術的進步,意藍的「AI輿情應變顧問」,則為此情境開創了全新的可能性。
AI輿情應變顧問基本介紹
意藍的「AI輿情應變顧問」結合DeepNLP與eLAND GOAT大語言模型,並以全台最大的網路口碑資料庫OpView作為資料基礎,僅須透過簡單的自然語句問答,AI 便會梳理大量文本並生成議題摘要內容,讓使用者能夠輕鬆且快速地掌握事件多面向輪廓。簡言之,其亮點特色如下:
  1. AI 技術結合完整、最新的在地資料,查詢結果可靠、可檢視
  2. 自然語句輸入生成列點式回答,快速了解事件全貌
接著,我們將以國內公開上市櫃公司中的王品集團,在一次食安事件風波中的應對過程為例,從事件發生、社群網路及大眾媒體公開討論,到最後事件妥善處理落幕,實際展示AI輿情應變顧問能夠在公關事件中起到怎麼樣的作用。
AI輿情應變顧問應用實例
首先,透過觀察聲量的趨勢圖,可以大致將此次公關事件劃分為三階段,分別是事件初爆發之前期、事件逐漸延燒之中期及事件落幕之後期。

▲王品集團食安事件 公關危機三階段

在公關事件爆發初期,品牌方會需要盡速釐清事件的來龍去脈,並盤點可能造成的相關影響,藉此評估危機嚴重程度。此時我們可以透過自然語言對AI輿情應變顧問進行提問,如輸入「最近王品集團食安議題發生原因為何?該事件有哪些影響層面?」,其便會以列點方式回答,顯示事件涉及顧客信任、經濟損失、衛生與法規問題等多個面向。

▲王品集團食安事件 輿情應變問答範例(前期)

而隨著公關事件逐漸延燒,品牌則需全面性地掌握社會大眾的關注重點,並決議以何種方式應對聲明、執行有效的止損措施。我們可以向AI輿情應變顧問提問「網友對於王品集團食安議題有哪些討論面向?」,根據其回覆,可以得知民眾在本次事件中在意的面向包含集團員工衛生管理是否確實、餐廳是否定期清潔消毒等,並關注集團後續面對顧客之補償措施。

▲王品集團食安事件 輿情應變問答範例(中期)

最後,在品牌針對該事件做出回應後,亦可透過觀察網友給予的回饋,檢視事件是否落幕、企業品牌是否重新拾回消費者信心。AI輿情應變顧問能夠協助總結品牌做出的處理方針與民眾反饋,包含以直播廚房作業加強消費者對餐廳衛生的信心,以及對消費者進行賠償、展現願意負責任的態度等,逐步平息公關危機與修復品牌形象。

▲王品集團食安事件 輿情應變問答範例(後期)

應用2:AI智能廣告投手

上段說明了AI技術的導入如何賦能企業迅速掌握輿情、有效應對公關危機;而除此之外,AI技術亦能為精準行銷、廣告投放等領域注入新動能。對於品牌而言,準確識別目標受眾並制定有效的行銷策略,可說是提升轉換率、加強顧客忠誠度的關鍵課題,而若企業品牌想要針對目標市場,精準觸及到關注自身或特定輿情的受眾,意藍的AI智能廣告投手便能有效提供協助。

AI智能廣告投手簡介
意藍的「AI智能廣告投手」結合了搜尋引擎、DeepNLP技術及大型語言模型,以AI分析《OpView社群口碑資料庫》上的社群輿情,並將數據轉化為對應「關注特定輿情」的人群樣貌,描繪出話題討論之關注受眾;使用者可以動態調整欲觀測之主題、期間以及來源,或進行網站探索以及自訂內容,最後系統將一次性地產出Google、Meta及PeopleView人群資料庫等多平台推薦的標籤結果,使品牌得以精準鎖定目標客群。

▲AI智能廣告投手亮點特色

AI智能廣告投手應用實例
我們以國內知名的金融業者為例,透過AI智能廣告投手,以公開的社群討論及媒體輿情為基礎,精準計算關注人群的樣貌,進一步顯示廣告投放平台Google Ads推薦的標籤查詢結果。如下圖,可見「玉山銀行信用卡」受眾的關注重點聚焦於房地產、信用與貸款等,競品「國泰世華銀行信用卡」之受眾則著重日常消費,如旅遊、家庭度假等,而此便可作為品牌投放廣告前拓眾的參考依據;經由探索自家與競品的受眾標籤,企業也能進一步選擇是要拓展相似標籤客群,抑或與競品作出區隔、創造獨特性。

▲玉山、國泰世華信用卡話題討論之受眾標籤;資料分析期間:2024Q1

另一方面,AI智能廣告投手也可用於探索特定頻道受眾,例如當品牌想尋找KOL(關鍵意見領袖,Key Opinion Leader)作為宣傳行銷活動的合作對象時,也可以分析關注該KOL的受眾樣貌,進一步探索其受眾標籤,確認與品牌想鎖定的客群是否契合。

▲AI智能廣告投手 特定KOL受眾標籤

在數據驅動的時代下,AI為各行各業注入了全新的動能,成為企業發展和創新的重要推手。透過AI技術與應用,企業得以借力使力,以更加智能、精準的分析實現更高效的運營,發掘出嶄新的商業機會。

想進一步了解「AI輿情應變顧問」和「AI智能廣告投手」嗎?

<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span>AI自然語言處理技術應用:意藍DeepNLP革新

精華文章AI自然語言處理技術應用:意藍DeepNLP革新

AI自然語言處理技術應用:
意藍DeepNLP革新

自然語言處理(Natural Language Processing,NLP)是AI技術的一種,目的在讓電腦能「理解」並「說出」人類的語言,而意藍DeepNLP深度語意分析模組則是商業化運用最成熟的NLP技術產品之一。本文除了說明自然語言處理技術的原理與優勢外,也將同步介紹意藍DeepNLP技術與AI應用的結合。

意藍的自然語言處理商業化應用

什麼是自然語言處理?

自然語言處理(Natural Language Processing,NLP)是AI人工智慧的一個分支領域,旨在讓電腦能夠「聽得懂」和「說得出」人類語言。

在自然語言處理的領域中,包含以下幾種常見的技術:

  1. 語意分析:理解文句中的意圖、情感,例如意藍自主研發的DeepNLP深度語意分析模組所提供的情緒分析、文本摘要、屬性詞分析等功能。
  2. 語音辨識:將語音轉換成對應的文字內容,例如Google的語音輸入功能。
  3. 文本生成:生成自然且合乎語法的文字內容,例如ChatGPT的文本識別、輸出功能。
  4. 機器翻譯:將文本從一種語言轉換成另一種語言,例如Google翻譯。

意藍DeepNLP技術服務內容
意藍的DeepNLP語意分析模組是國內最早投入,也是商業化應用最成熟的自然語言處理技術產品,能透過深度學習擷取非結構化資料的文本內容、判讀語意情緒、自動摘要文本重點、分析特徵詞與斷詞,將質化文本用於量化統計。
而DeepNLP技術也被應用在意藍的產品當中,其中OpView雲端資料分析服務會針對大量的輿情資料進行情緒分析,來理解文本中的情感,辨別出文本表達的情感是正面、負面或是中立,幫助企業了解輿情對產品、品牌或事件的態度,有助於調整行銷策略和危機應對。除此之外,透過DeppNLP技術還可以抓取文本中的重點資訊,進而掌握公眾關注的重點面向或事件,以制定相應的決策和宣傳方案。透過自動摘要則可以從文本中提取出重要的句子或段落,生成簡潔的摘要,有助於企業迅速理解和分析大量的文本資訊。

大語言模型的興起與優勢

大語言模型的核心特點
大語言模型(Large Language Models,LLM) 是基於自然語言處理所發展的技術,能夠進一步理解自然語言文本,並生成各式各樣的內容,目前國際上較為知名的大語言模型包含OpenAI的GPT系列、Meta的LLaMa系列、Google的Gemini與Gemma系列等。為讓大語言模型能夠更加在地化,國內也積極研發本土大語言模型,如意藍所發展之eLAND GOAT。而大語言模型則主要有以下幾個核心特點:
  1. 大量的數據訓練:透過讓模型從大量文本數據中訓練來學會語言知識。
  2. 上下文理解:能夠理解和生成上下文相關的文本,提供流暢的回覆。
  3. 應用場景廣:有別於過往的模型多只在特定領域表現良好,大語言模型可以用於多種自然語言處理任務上,包括文本生成、翻譯、摘要、問答等。
大語言模型對自然語言處理的強化

大語言模型的發展推動了自然語言處理技術的進步,透過持續的訓練模型,可以更強化自然語言處理的效果,包含:

  1. 語意理解能力更佳:能夠更準確地理解文本中的語意,從而提高自然語言處理系統的性能。
  2. 文本生成能力更強:能夠生成更自然、連貫甚至更貼合使用者需求的文本,在聊天機器人和文本生成工具等方面都有很大的應用潛力。
  3. 多語言處理能力更好:具備多語言處理能力,可以在多種語言之間,進行翻譯和語意的理解。
 

意藍結合搜尋技術、自然語言處理與大語言模型,提升產品效果與體驗

隨著近年生成式AI技術的竄起,意藍也跟上這波技術革新的潮流,基於原有的搜尋技術與DeepNLP技術,再結合生成式AI技術如大語言模型來優化產品服務與體驗,包括:

  1. OpView:意藍運用大語言模型在生成文本上的能力,提供輿情摘要功能,讓使用者在進行輿情觀測與分析時,可以跳脫過往繁瑣的工作流程(例如:在框定議題範圍後,還需人工一篇一篇檢視、吸收消化再整理成重點等耗費時間的作業模式),更快速有效率的取得議題、貼文的討論重點。  此外,OpView也結合大語言模型推出新功能「AI輿情應變顧問」及「AI智能廣告投手」,讓使用者不僅可以在平台上進行輿情觀測與分析,更能進一步地根據輿情資訊,了解關注受眾的樣貌,進而作為精準行銷及廣告投放之參考依據。其中,在AI輿情應變顧問中,意藍結合自身的搜尋引擎技術與檢索增強生成(Retrieval-Augmented Generation, RAG) 技術,讓使用者可以在短時間內,便獲得由AI從數以萬計的輿情資料中萃取、彙整並消化重點後所進行的問題回覆。
  2. AI Search for KM:意藍結合DeepNLP技術、大語言模型以及搜尋引擎技術,提供知識搜尋與問答的服務,可以作為企業的AI知識助理或AI學習教練,能快速的從大量的檔案文件中找出所需內容,並附上參考內容出處供驗證。本產品透過自然語言處理技術結合語意向量搜尋,可以進一步從相關檔案文件中,找出與使用者問題最相關的資訊,再由意藍發展的eLAND GOAT大語言模型加以彙整、內化後,以自然語言的形式回覆給使用者,協助使用者可以快速地取得精準且易懂的問題回覆,解答自身問題、減輕知識內化的時間成本與負擔。

意藍將DeepNLP技術與大語言模型結合,提升產品服務多樣性,藉由AI協助企業客戶簡化輿情分析、知識檢索的繁瑣流程與成本,實現更全面的商業應用服務。 

想進一步了解更多意藍AI技術嗎?

<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span>本土生成式AI大語言模型的發展與優勢:意藍輿情GPT的技術與應用

精華文章本土生成式AI大語言模型的發展與優勢:意藍輿情GPT的技術與應用

本土生成式AI大語言模型的發展與優勢:
意藍輿情GPT的技術與應用

大語言模型的優勢在於使用了先進的自然語言處理技術,由大參數量的深度學習架構,加上大規模的學習語料,來達到自行理解詞句間關係的能力,進而依照提示來生成各種內容,可以廣泛應用在多種場景,例如理解文章、生成摘要、依提示寫作及問答等。而由於目前繁體 (正體) 中文語料相對較少的緣故,台灣各界都開始投入蒐集與標註繁體中文語料,並以建置本土大語言模型為目標。

本期 AI 知識庫亮點

生成式AI大語言模型的核心特點
本土生成式AI大語言模型的可能性
意藍資訊的生成式AI應用內容

AI大語言模型的核心特點

什麼是大語言模型?
大語言模型 (Large Language Model,LLM) 是一種基於大量資料訓練而成的深度學習模型,其特色在於模型參數量大、學習訓練資料量大。而模型的核心特點在於訓練過程中,可以自行學習、理解大量資料中每個詞句間的關係與背後的意義,成為基礎的預訓練 (pre-train) 模型,隨後再依照不同的任務類別進行微調 (fine-tune),例如成為可以根據指令來提供符合邏輯的自然語言回應。 大語言模型的工作邏輯就好比文字接龍遊戲、或是猜測下一字詞的智慧型輸入法,使用者在輸入詞句後,大語言模型便會根據過學習、訓練的資料,來評估詞句背後高機率會產生的字詞為何,並進行相對應的文字生成。
大語言模型的優勢為何?

大型語言模型的優勢在於使用更先進的NLP (Natural Language Processing),也就是自然語言處理技術。相較於傳統的自然語言處理技術,大型語言模型的優勢包含:

(1)上下文理解:不是只針對字詞本身來解釋,而是透過分析上下文來更好地理解和處理文意,可以解決單一字詞依上下情境會有不同解釋的問題,所生成的回應也會更有連貫性且有邏輯。

(2)多任務適用:經過預訓練的大語言模型,就像有了基本語文能力的AI,對處理各種自然語言處理的任務都會大有幫助,例如有了基本語文能力,則學測中的克漏字測驗、改錯、造句、摘要、閱讀理解等分數都會上升,不需要單獨為每種任務來設計特定的模型,讓模型的應用更多元、廣泛。

(3)大規模資料訓練:透過數十億字符 (token)、甚至到上兆等級 (tera-) 的語料進行大規模的學習,讓模型能夠掌握更豐富的知識,從書籍、百科、論文、資料庫、網頁內容、社群貼文等,進而做出更好的理解與回覆。

本土生成式AI大語言模型的可能性

台灣大語言模型的發展

由於目前主流的大語言模型,如OpenAI的GPT系列,或是Meta的LLaMa系列,在訓練時所使用的語料都以英文為大宗,而中文語料佔比都非常低,其中大部分資料又為簡體中文,和繁體、台灣地區所慣用之用字遣詞有一定差距,因此台灣的產、官、學界也都持續致力於台灣本土大語言模型的發展,如國科會的TAIDE模型、台智雲公司的FFM(Formosa Foundation Model)、聯發科公司下聯發創新基地的breeze模型,以及作為國內自然語言處理的先導廠商 – 意藍資訊所發展之eLAND GOAT模型,目標均是讓大型語言模型能夠更加在地化。

意藍資訊在生成式AI大語言模型的發展
大語言模型的訓練是依靠大量高品質的數據資料來執行,而意藍資訊累積超過十年、規模最大的台灣公開社群與網路輿情資料,包含國人常用的各大社群平台、問答網站、評論網站、討論區、公開內容等,這些繁體中文語料就是生成式AI最好的學習教材。除此之外,意藍也發展了自己的自然語言處理演算法與模型,且經過第三方機構的驗證,語意判斷的準確度高達九成。此外,在相關性檢索、情緒判別、與AI對話等競賽中都名列前茅。故在台灣大語言模型的發展中,意藍資訊具備生成式AI領域中最核心的資料、演算法與應用,擁有如輿情分析、數位人群分析、電商搜尋推薦引擎、知識檢索與問答等不同的商業應用方向。

意藍資訊的AI應用內容

輿情GPT的特色與優勢
在研發大語言模型上,由於意藍資訊擁有全台最大、最完整的OpView社群口碑資料庫,再結合意藍訓練研發的自然語言處理技術DeepNLP,成功打造出領先全台的「輿情GPT」服務,讓輿情GPT在面對巨量的語料能夠更有效地處理並加以運用。只需要在輿情GPT中輸入簡單的關鍵詞,便可以在最短時間找出相關的資料,並藉由大型語言模型來生成口語化、條列重點的輿情精華摘要,解決過去在解讀輿情話題時,需要逐篇話題一一進行檢視、理解的大量時間。除此之外,輿情GPT強大的質化分析能力,能讓企業即時掌握突發公關事件的輿情走向,或精準抓住行銷上的流行爆紅元素。
生成式AI技術未來展望
隨著大型語言模型的能力越來越強,大眾對於資訊安全和資料保密議題的重視也日漸增加。企業在大語言模型應用上,常會受限於服務供應商多為公有雲的緣故,不放心將企業重要資訊上傳外露,使得無法讓模型在具備企業內部知識的情況下,提供更精確的產出結果。因此,意藍資訊持續發展企業專屬的地端 (on-premise) 模型,提供企業小型化、客製化的模型選項,並且不斷的探索大型語言模型的應用場景,嘗試、解決企業遇到的商業問題。
想進一步了解更多意藍AI技術嗎?

Copyright eLAND Information Co., Ltd.