<span style=" display: block; font-siz0.8em; font-wE_eight: 100; color: #A5A3A3;">精華文章</span>AI驅動的城市未來:意藍資訊AI智能搜尋解決方案

精華文章AI驅動的城市未來:意藍資訊AI智能搜尋解決方案

AI驅動的城市未來:
意藍資訊AI智能搜尋解決方案

意藍資訊 (6925) 是國內首家公開掛牌的AI智能數據代表廠商, 憑藉自有核心技術 Search搜尋、NLP語意分析、ETL數據處理,更進一步結合生成式AI,為企業/組織提供多元的新一代AI智能解決方案。

意藍資訊核心技術

意藍資訊的核心技術包含Search搜尋、NLP語意分析、ETL數據處理:

意藍資訊的核心技術包含Search搜尋、NLP語意分析、ETL數據處理

  • Search搜尋:

    以工業級C++技術打造自有核心,並透過獨家的P2P點對點分散式部署架構,讓系統可以乘載巨量數據處理規模,並保有遠勝於開源項目的處理效能、同時具備良好的多國語言搜尋能力。

  • NLP語意分析

    意藍在自然語言處理上專研多年,以深度學習(Deep Learning)技術為基礎打造出新一代的語意分析核心技術(Deep NLP),提供包含斷詞、情緒分析、屬性詞擷取、自動摘要等成熟技術,兼具準確度及處理效能,可連續處理巨量數據,並從數據中學習。

  • ETL數據處理

    透過分散式平行化自動擷取架構,讓意藍在資料爬取與清理方面,可以適應多種數據,處理量大、變動快的非結構化資料,讓各使用單位可以即時快速、有系統地運用所需資料。

而乘著AI熱潮,意藍更進一步結合生成式AI,開發出eLAND GOAT大語言模型及檢索增強生成RAG(Retrieval-Augmented Generation)技術,推出各式AI智能搜尋解決方案,滿足企業在不同場域的應用需求;而以下將自「智慧城市災防應變」、「智慧政府民意陳情資料分析」兩大應用情境為例,向大家介紹意藍如何為合作夥伴實現AI落地應用。

意藍AI Search智能搜尋解決方案

協助智慧城市災防應變數據分析

面對嚴峻的自然災害挑戰,災害防救單位需快速且準確地掌握災情資訊,提升災害應變效率。而意藍透過先進的AI技術,結合社群輿情資料和專屬的歷史數據庫,為災害防救單位提供高效的解決方案,解決資訊來源分散、數據處理繁複等痛點,協助單位提升資訊處理效率,並提供數據支持決策判斷,以便更好地應對和管理災害風險。分項說明如下:

[AI結合社群輿情資料,協助城市災防治理 – 分析儀表板]

為即時蒐集社群輿情中的災情資訊,意藍擷取分析眾多公開網站頻道的資料源,涵蓋各大公開媒體、Facebook粉絲團、Dcard、巴哈姆特各地區版、Mobile01地區版及PPT地區版等等,將巨量資料結構化並過濾之後,透過意藍的搜尋引擎,便可針對大量資料做搜尋。

接著,透過語意分析技術,讓AI自動判別每一篇災情文章內容中提及的地理資訊、災害事件以及災情程度等,將這些重要詞彙辨識出來並自動標記。

最後,將這些社群輿情中的災情內容與AI自動標記之結果,展示在分析儀表板上,讓災害防救應變相關單位可以利用搜尋快速找到相關內容,並從儀表板了解與統計各個地方民意反映的災情狀況、發生頻率等等,以利後續分析和災防治理。

[AI結合歷史數據,協助應對自然災害 – 歷史災害事件問答]
配合災害防救單位之需求,意藍利用生成式AI與自然語言模型,整合歷史災害防救數據,結合eLAND的AI Search For KM服務,建立災害防救事件問答系統,幫助災害管理或救援人員應對自然災害的挑戰。 災害防救單位可針對歷年災害事件做問答,AI Search for KM系統會依據提問找到多個參考段落,再由大語言模型綜合歸納出完整的答覆。以下為幾個問答情境:
  1. 山竹颱風在哪些地區有較大雨勢?
    AI Search for KM 回覆:根據提供的文章資料,我們可以得知山竹颱風在【文章A】、【文章B】和【文章C】中提到了有較大雨勢的地區。在這些文章中,指出受颱風外圍環流影響,花蓮、台東、屏東縣(山區、恆春半島)將有較大雨勢發生。此外,【文章C】也提到了台灣東部、屏東縣(山區、恆春半島)及南投縣、高雄市山區也將有較大雨勢發生。因此,根據這些文章的資訊,山竹颱風預計會在花蓮、台東、屏東、南投和高雄等地區帶來較大的雨勢。
  2. 梅姬颱風對台東造成什麼災情?
    AI Search for KM 回覆:梅姬颱風對台東造成了顯著的災情,包括淹水、道路坍方和農業損失。根據【文章F】,台東縣知本溪流域溫泉橋上游左岸堤防溢堤,導致溫泉村40戶民宅淹水,而右岸山坡則有雨水夾帶土石沖入富野飯店,民宅內土砂淤積達50公分以上。此外,梅姬颱風也對台東及屏東部分地區造成淹水和道路坍方,農業損失約1.9億元,並造成12人受傷。這些災情反映了梅姬颱風對台東地區的嚴重影響,包括對居民生活、基礎設施和農業的破壞。
  3. 梅姬颱風會對哪些地區影響較劇烈?
    AI Search for KM 回覆: 梅姬颱風對臺灣的影響最劇烈的地區包括臺北市、新北市、桃園市、新竹縣市、基隆市、花蓮縣、臺東縣、屏東縣、高雄市、臺南市、嘉義縣市、雲林縣、彰化縣及澎湖縣。這些資訊來自於【文章G】,其中明確指出這些縣市為梅姬颱風風災高風險區。此外,【文章H】 也提到梅姬颱風10級風暴風圈主要通過的縣市包括花蓮縣、臺東縣、屏東縣、高雄市、臺南市、嘉義縣市、雲林縣、彰化縣、南投縣、及澎湖縣,這進一步確認了上述地區將受到較劇烈的影響。這些資料綜合顯示,梅姬颱風將對臺灣南部、東部以及部分中部和北部地區帶來顯著的風災和降雨影響。
智慧政府民意及民眾陳情資訊分析

地方政府經年累月從派工系統、話務系統、人民陳情與市長信箱等來源接獲的民眾陳情資料相當龐雜,無論是市府人員後續欲整理民眾陳情資料進行分析,或是借鑒過往民眾陳情案件的回覆用於新案件回覆,皆費時費力;因此,意藍運用AI技術,提供市府陳情儀表板與陳情問答輔助解決方案,協助地方政府得以更有效分析資料及輔助陳情回覆。分項說明如下:

[AI語意分析結合資訊結構化處理 – 陳情儀表板]
整合各來源資料,並透過意藍DeepNLP技術,分析民眾陳情情緒、擷取陳情內容特徵資訊等,整理成結構化資訊。接著,採用意藍搜尋引擎技術,讓使用者可以藉由彈性的檢索條件快速查詢到想了解的特定陳情案件。
最後則進一步將結構化後的陳情資料整合成儀表板,提供視覺化圖表供使用者可以快速、清晰的了解案件概況與量化數值,並應用於後續分析。
[AI智能問答 – 陳情客服輔助]

在此項解決方案中,政府單位人員可直接輸入收到的民眾陳情內容,陳情問答輔助服務會先去除其中的個資及敏感資訊,嚴格控管資安不外洩,再將陳情內容清整後與過往陳情案件進行比對,獲取與本次陳情相關、過往曾經處理過的案件資訊,並透過生成式AI整合後產出AI自動回覆模板,輔助政府單位人員更有效率的回覆陳情案件,提升客服效率並減輕人力負擔。

此外,意藍的陳情客服輔助服務也具備以下特點:
  1. 回覆模板有依據
    服務會自動參考過去相關案件的回覆,以過往的回覆格式與內容為參考,產出適合的回覆內容提供給使用者
  2. 自訂聯絡資訊
    在產出的回覆模板中,使用者可以自己彈性設定應在回覆中顯示何種聯絡資訊
  3. 自訂單位名稱
    在產出的回覆模板中,使用者也可以自行設定在回覆中欲呈現的單位名稱資訊

意藍資訊 (6925)將生成式AI與自身核心技術結合,提供多元的AI Search智能搜尋解決方案,賦能合作夥伴,實現了AI技術在智慧城市災防應變,以及智慧政府民意及民眾陳情資訊分析的落地應用,為AI未來城市發展注入新的動能。

想進一步了解更多意藍AI技術嗎?
<span style=" display: block; font-siz0.8em; font-wE_eight: 100; color: #A5A3A3;">精華文章</span>生成式AI的商業機會與挑戰:意藍資訊在 AI 技術上的應用

精華文章生成式AI的商業機會與挑戰:意藍資訊在 AI 技術上的應用

生成式AI的商業機會與挑戰:
意藍資訊在 AI 技術上的應用

生成式AI是一種人工智慧技術,主要特點是能夠生成新的內容,例如文字、圖像或音訊,來解決問題。而意藍資訊除了有自行研發的大語言模型eLAND GOAT外,也推出了許多的AI智能數據解決方案。

本期 AI 知識庫亮點

認識生成式AI

生成式AI的原理是什麼?
生成式AI是 基於深度學習,透過擁有大參數量的神經網絡來記憶學習大量的資料,並且在沒有明確標籤或指導之下,自行學習資料的分佈,來生成更多類似的資料。工作邏輯就好比文字接龍遊戲,使用者在輸入詞句後,生成式AI便會根據過往學習時曾看過的訓練資料,來評估該詞句接下來在高機率的情況下會產生的字詞為何,並進行相對應的文字生成。

目前的生成式AI通常會配合兩種建立模型的技術,第一個是預訓練 (pre-train),也就是先在沒有特定任務目標的情況下先進行模型的訓練,之後再將該訓練好的模型投入到實際應用中。打一個比方,就像預先訓練AI的基本語文能力,之後在克漏字測驗、改錯、造句、摘要、閱讀理解等任務上都會用到這些能力;另一個是大模型 (large model),包括不斷推升神經網路模型的參數量規模,以及給予更多的訓練資料,都是希望讓生成式AI的能力及適用狀況可以更加地擴大。

生成式AI的應用場域與未來發展

生成式AI的應用實例
生成式AI可以在文書生成、摘要、提供方法推論、回答知識題等方面提供協助,並且也能在行銷、廣告、政治社會等領域,甚至是學術研究、政府單位當中扮演探索或發想性質的角色。不過需要注意的是,若是要針對如計算題這種有標準答案的內容時,生成式AI有時可能無法完全正確的回應,這時就會需要仰賴使用者再多留意與求證。
生成式AI的挑戰與未來趨勢
2023年劍橋字典選出的年度代表字:Hallucination (幻想),其便反應了人工智慧的可信賴性會是一大挑戰,尤其生成式AI有杜撰、編造消息來源的不可控性。因為生成式AI的能力一大部分是仰賴過往曾經看過的訓練資料再經過類似機率選擇的過程來生成內容,因此存在不確定性,以及拼湊內容、無中生有的可能。另外,生成式AI還有資安風險的隱憂,例如提供的資訊被模型業者拿去做為訓練模型之用,而近來也有許多例子都能證實,即使在訓練模型時設了重重關卡,訓練出來的模型還是可能會在無意之間把公司內的機敏資料洩漏出去。

而要克服這些問題,首先我們要能讓AI產出的答案變成是載明參考資料出處且可驗證的。在未來,生成式AI模型一定會不斷推陳出新,成為繼30年前圖形化界面 (Graphical User Interface) 之後,最大的一個人機界面革命,可以理解使用者的口語表達並完成各項任務的自然介面 (Natural User Interface)。目前已有利用生成式AI的自動化框架,能夠將一個任務的所有工作流程進行拆解的案例,使得生成式AI可以去完成每一個環節相應的步驟,成為生成式AI發展的趨勢方向。

意藍資訊的AI服務應用

意藍大語言模型eLAND GOAT 與 OpenAI的差異
而為了解決生成式AI在應用上的幻想杜撰、資安等問題,以及台灣本土大語言模型缺乏繁體 (正體) 中文語料等情況,意藍資訊也在AI領域持續追求成長與卓越。相較於OpenAI的GPT模型,由意藍所自行研發出的大語言模型eLAND GOAT,即是以大量台灣社群網站、網路媒體的繁體中文語料進行訓練,具備了更好的繁體中文理解、生成能力,在使用上能夠提供更為在地化的體驗。此外,相較於OpenAI僅提供放在公有雲上的模型,eLAND GOAT能夠提供企業小型化、特式化 (specialized) 的地端模型,可以運行在企業內部環境中,依循企業組織的權限設定,滿足企業對於資安上的需求。
意藍AI智能數據解決方案

除了大語言模型eLAND GOAT,意藍資訊也致力於發展各式AI智能數據解決方案,來滿足客戶在不同場域的各種需求,如:

  1. 輿情GPT

    結合全台最大的社群口碑資料庫OpView,讓使用者能夠在輸入簡單的關鍵詞後,快速找出最相關的資料,並藉由生成式AI來生成口語化、條列重點的輿情精華摘要,解決過去在解讀社群輿情時,需要人工對話題逐篇檢視、理解的時間。

  2. AI Search for EC 新一代智能貼標與搜尋推薦系統

    以AI語意分析技術,自動解析商品中所帶有的各式資訊文本,生成能代表商品的重點標籤,再綜合評估聲量、搜量、銷量等多元指標,能有效解決電商品牌在商品曝光、推薦、搜尋引擎優化上的各項痛點,讓消費者可以更精準的找所需的商品。

  3. AI Search for KM 新一代生成式AI知識管理系統

    整合了生成式AI、搜尋引擎,和NLP(自然語言處理)技術,讓企業員工只要上傳知識文件後,就可以輕鬆地檢索和提問,且AI Search for KM專注於企業自身所建構的知識庫,確保回答乃基於實際數據和企業內部知識,並提供地端運算方案,避免內部資料外洩風險。

想進一步了解更多意藍AI技術嗎?
<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span>本土生成式AI大語言模型的發展與優勢:意藍輿情GPT的技術與應用

精華文章本土生成式AI大語言模型的發展與優勢:意藍輿情GPT的技術與應用

本土生成式AI大語言模型的發展與優勢:
意藍輿情GPT的技術與應用

大語言模型的優勢在於使用了先進的自然語言處理技術,由大參數量的深度學習架構,加上大規模的學習語料,來達到自行理解詞句間關係的能力,進而依照提示來生成各種內容,可以廣泛應用在多種場景,例如理解文章、生成摘要、依提示寫作及問答等。而由於目前繁體 (正體) 中文語料相對較少的緣故,台灣各界都開始投入蒐集與標註繁體中文語料,並以建置本土大語言模型為目標。

本期 AI 知識庫亮點

生成式AI大語言模型的核心特點
本土生成式AI大語言模型的可能性
意藍資訊的生成式AI應用內容

AI大語言模型的核心特點

什麼是大語言模型?
大語言模型 (Large Language Model,LLM) 是一種基於大量資料訓練而成的深度學習模型,其特色在於模型參數量大、學習訓練資料量大。而模型的核心特點在於訓練過程中,可以自行學習、理解大量資料中每個詞句間的關係與背後的意義,成為基礎的預訓練 (pre-train) 模型,隨後再依照不同的任務類別進行微調 (fine-tune),例如成為可以根據指令來提供符合邏輯的自然語言回應。 大語言模型的工作邏輯就好比文字接龍遊戲、或是猜測下一字詞的智慧型輸入法,使用者在輸入詞句後,大語言模型便會根據過學習、訓練的資料,來評估詞句背後高機率會產生的字詞為何,並進行相對應的文字生成。
大語言模型的優勢為何?

大型語言模型的優勢在於使用更先進的NLP (Natural Language Processing),也就是自然語言處理技術。相較於傳統的自然語言處理技術,大型語言模型的優勢包含:

(1)上下文理解:不是只針對字詞本身來解釋,而是透過分析上下文來更好地理解和處理文意,可以解決單一字詞依上下情境會有不同解釋的問題,所生成的回應也會更有連貫性且有邏輯。

(2)多任務適用:經過預訓練的大語言模型,就像有了基本語文能力的AI,對處理各種自然語言處理的任務都會大有幫助,例如有了基本語文能力,則學測中的克漏字測驗、改錯、造句、摘要、閱讀理解等分數都會上升,不需要單獨為每種任務來設計特定的模型,讓模型的應用更多元、廣泛。

(3)大規模資料訓練:透過數十億字符 (token)、甚至到上兆等級 (tera-) 的語料進行大規模的學習,讓模型能夠掌握更豐富的知識,從書籍、百科、論文、資料庫、網頁內容、社群貼文等,進而做出更好的理解與回覆。

本土生成式AI大語言模型的可能性

台灣大語言模型的發展

由於目前主流的大語言模型,如OpenAI的GPT系列,或是Meta的LLaMa系列,在訓練時所使用的語料都以英文為大宗,而中文語料佔比都非常低,其中大部分資料又為簡體中文,和繁體、台灣地區所慣用之用字遣詞有一定差距,因此台灣的產、官、學界也都持續致力於台灣本土大語言模型的發展,如國科會的TAIDE模型、台智雲公司的FFM(Formosa Foundation Model)、聯發科公司下聯發創新基地的breeze模型,以及作為國內自然語言處理的先導廠商 – 意藍資訊所發展之eLAND GOAT模型,目標均是讓大型語言模型能夠更加在地化。

意藍資訊在生成式AI大語言模型的發展
大語言模型的訓練是依靠大量高品質的數據資料來執行,而意藍資訊累積超過十年、規模最大的台灣公開社群與網路輿情資料,包含國人常用的各大社群平台、問答網站、評論網站、討論區、公開內容等,這些繁體中文語料就是生成式AI最好的學習教材。除此之外,意藍也發展了自己的自然語言處理演算法與模型,且經過第三方機構的驗證,語意判斷的準確度高達九成。此外,在相關性檢索、情緒判別、與AI對話等競賽中都名列前茅。故在台灣大語言模型的發展中,意藍資訊具備生成式AI領域中最核心的資料、演算法與應用,擁有如輿情分析、數位人群分析、電商搜尋推薦引擎、知識檢索與問答等不同的商業應用方向。

意藍資訊的AI應用內容

輿情GPT的特色與優勢
在研發大語言模型上,由於意藍資訊擁有全台最大、最完整的OpView社群口碑資料庫,再結合意藍訓練研發的自然語言處理技術DeepNLP,成功打造出領先全台的「輿情GPT」服務,讓輿情GPT在面對巨量的語料能夠更有效地處理並加以運用。只需要在輿情GPT中輸入簡單的關鍵詞,便可以在最短時間找出相關的資料,並藉由大型語言模型來生成口語化、條列重點的輿情精華摘要,解決過去在解讀輿情話題時,需要逐篇話題一一進行檢視、理解的大量時間。除此之外,輿情GPT強大的質化分析能力,能讓企業即時掌握突發公關事件的輿情走向,或精準抓住行銷上的流行爆紅元素。
生成式AI技術未來展望
隨著大型語言模型的能力越來越強,大眾對於資訊安全和資料保密議題的重視也日漸增加。企業在大語言模型應用上,常會受限於服務供應商多為公有雲的緣故,不放心將企業重要資訊上傳外露,使得無法讓模型在具備企業內部知識的情況下,提供更精確的產出結果。因此,意藍資訊持續發展企業專屬的地端 (on-premise) 模型,提供企業小型化、客製化的模型選項,並且不斷的探索大型語言模型的應用場景,嘗試、解決企業遇到的商業問題。
想進一步了解更多意藍AI技術嗎?

Copyright eLAND Information Co., Ltd.