產品服務

產品服務

API 服務

我們率先推出的 Articut 文截斷詞暨詞性標記服務 API 可讓您在取得中文篇章的斷詞結果的同時,還能知道各個詞彙在這個句子中扮演的詞性。

應用展示

自然語言處理是智慧人機介面的基礎。在「卓騰語言科技展示平台」上,我們製作了多個在底層利用中文斷詞技術的智慧應用。內容包括文本分析的服務、語言障礙的輔具、還有新聞內容自動整理判讀的應用,竭誠歡迎您來試用,並洽詢技術細節。

零老師自學平台

除了應用以外,卓騰也利用我們對人類語言發展的知識,打造了不受時間和空間限制的「零老師」自學平台。不論是正在學習中文的成人,或是就讀小學的孩童,都能透過零老師自學平台內的練習,直接刺激語言中樞,在磨練對中文語言結構的敏感度的同時,累積詞彙量。訂閱零老師自學平台後,更能每週取得自身的程度評估記錄,和同年齡、同程度、同地區或不同地區的語言學習者一起比較,評估自己的語言能力。

卓騰 Articut 斷詞引擎的優勢

中文斷詞是什麼?

「斷詞」也稱「分詞」,是用電腦程式將一個中文句子中的「詞」用空白(或其他符號)斷開或分開。以「人工智慧幾乎是一門人文學科」這個句子為例,經過斷詞處理後,我們希望可以得到…

人工智慧/幾乎//一門/人文學科

這樣的斷詞結果。

相較之下,英文的句子…

Artificial intelligence is almost a humanities discipline. (Sebastian Thrun, the CEO of Udacity)

因為有空白符號將詞分開,因此並不需要斷詞處理。

中文由於字字相連的特性,沒有像英文的空白符號告訴我們句子中各個詞的邊界,若不做斷詞處理,電腦能處理的最小單位的文字,就只能是「單一字符」了。但單一符號並不是語意的基本元素,「詞」才是。因此,我們必須先知道一個句子中的「詞」在哪裡,才能往下進行各種語意上的研究和應用,如:語意分析、機器翻譯、關鍵資訊檢索等等。

雖然,中文斷詞是電腦分析語意的最基礎技術,不過,受惠於目前免費的如中研院 CKIPJieba 等斷詞工具(嚴格說來中研院 CKIP 並不是免費的斷詞工具),擁有自己斷詞演算法的資訊公司卻很少。當我們使用他人開發的工具的同時,表示我們自己無法直接從底層修改或調整工具所產生的錯誤。由於斷詞是最基礎工作,底層的錯誤若不能修正,則隨著應用層的疊加,錯誤會持續累積,進而擴大影響後續應用的結果。基於這個理由,再加上跨「語言學」與「資訊科學」的專業,卓騰團隊開發了「不使用統計方法」的「語言學規則斷詞」工具:Articut 文截斷詞。

Articut 文截斷詞 FAQ

關於卓騰

卓騰語言科技公司是由一群受過現代語言學訓練的專家組成的新創公司。透過電腦科技,我們企圖導入人類習得語言的機制,避免對語料庫以及網路的依賴,再利用語音辨識和句法分析、語意提取…等等技術,讓最自然不過的語言成為人類和機器之間的介面。

「卓騰」取自英文 Droidtown 的音譯,在為機器心智注入更多人性之餘,我們更期許自己成為未來機器心智的家鄉 (hometown)。我們企圖讓機器不只聽懂人話,更能了解背後的意義。我們的目的不在製造取代人類的機器管家,而是造出能永遠擔任人類副手的貼心助理。

我們的專業領域包括無資料庫語音辨識、機器自動語意分析及智慧回饋、自然語言搜尋引擎、文本結構分析、文本資料探勘及相關語言科技之教育訓練…等。藉由將現代語言學的邏輯方法引入電腦科技的演算中,卓騰的願景是能讓無生命的機器真正地理解人類用最自然的說話表達的每個字句。

企業用戶

聯絡我們

對於我們的服務有任何興趣或疑問,歡迎與我們聯繫!

請輸入您的稱呼。

請輸入您的 Email。

請輸入您的訊息。