產品服務

產品內容

我們致力於發展自然語言處理的領域,開發出 Articut 詞性標記、Loki 語意理解及 KeyMoji 情緒分析系統,每套系統都在語意理解上扮演重要的角色。

自傳仙貝

自傳仙貝輔寫系統利用最新 NLP (自然語言處理) AI 技術,搭配業界專家精心編寫的判斷建議,讓您在撰寫求職自傳時,專注在能打動目標企業的描述內容,有效提升你的面試機會!

卓騰 Articut 斷詞引擎的優勢

中文斷詞是什麼?

「斷詞」也稱「分詞」,是用電腦程式將一個中文句子中的「詞」用空白(或其他符號)斷開或分開。以「人工智慧幾乎是一門人文學科」這個句子為例,經過斷詞處理後,我們希望可以得到…

人工智慧/幾乎//一門/人文學科

這樣的斷詞結果。

相較之下,英文的句子…

Artificial intelligence is almost a humanities discipline. (Sebastian Thrun, the CEO of Udacity)

因為有空白符號將詞分開,因此並不需要斷詞處理。

中文由於字字相連的特性,沒有像英文的空白符號告訴我們句子中各個詞的邊界,若不做斷詞處理,電腦能處理的最小單位的文字,就只能是「單一字符」了。但單一符號並不是語意的基本元素,「詞」才是。因此,我們必須先知道一個句子中的「詞」在哪裡,才能往下進行各種語意上的研究和應用,如:語意分析、機器翻譯、關鍵資訊檢索等等。

雖然,中文斷詞是電腦分析語意的最基礎技術,不過,受惠於目前免費的如中研院 CKIPJieba 等斷詞工具(嚴格說來中研院 CKIP 並不是免費的斷詞工具),擁有自己斷詞演算法的資訊公司卻很少。當我們使用他人開發的工具的同時,表示我們自己無法直接從底層修改或調整工具所產生的錯誤。由於斷詞是最基礎工作,底層的錯誤若不能修正,則隨著應用層的疊加,錯誤會持續累積,進而擴大影響後續應用的結果。基於這個理由,再加上跨「語言學」與「資訊科學」的專業,卓騰團隊開發了「不使用統計方法」的「語言學規則斷詞」工具:Articut 文截斷詞。

Articut 文截斷詞 FAQ

關於卓騰

卓騰語言科技公司是由一群受過現代語言學訓練的專家組成的新創公司。透過電腦科技,我們企圖導入人類習得語言的機制,避免對語料庫以及網路的依賴,再利用語音辨識和句法分析、語意提取…等等技術,讓最自然不過的語言成為人類和機器之間的介面。

「卓騰」取自英文 Droidtown 的音譯,在為機器心智注入更多人性之餘,我們更期許自己成為未來機器心智的家鄉 (hometown)。我們企圖讓機器不只聽懂人話,更能了解背後的意義。我們的目的不在製造取代人類的機器管家,而是造出能永遠擔任人類副手的貼心助理。

我們的專業領域包括無資料庫語音辨識、機器自動語意分析及智慧回饋、自然語言搜尋引擎、文本結構分析、文本資料探勘及相關語言科技之教育訓練…等。藉由將現代語言學的邏輯方法引入電腦科技的演算中,卓騰的願景是能讓無生命的機器真正地理解人類用最自然的說話表達的每個字句。

企業用戶

聯絡我們

對於我們的服務有任何興趣或疑問,歡迎與我們聯繫!

請輸入您的稱呼。

請輸入您的 Email。

請輸入您的訊息。