理解語言
手繪筆記由 Nitya Narasimhan 提供。點擊圖片查看大圖。
課前測驗
簡介
在上一課中,你將語音轉換為文字。為了將其用於編程智能計時器,你的代碼需要理解所說的內容。你可以假設用戶會說固定的短語,例如「設置三分鐘計時器」,並解析該表達式以獲取計時器應設置的時間,但這對用戶來說並不友好。如果用戶說「設置計時器三分鐘」,你或我會理解他們的意思,但你的代碼不會,它會期望一個固定的短語。
這就是語言理解的作用,使用 AI 模型來解釋文本並返回所需的詳細信息,例如能夠理解「設置三分鐘計時器」和「設置計時器三分鐘」,並理解需要設置一個三分鐘的計時器。
在本課中,你將學習語言理解模型,如何創建它們、訓練它們以及如何從代碼中使用它們。
在本課中我們將涵蓋:
語言理解
人類已經使用語言進行交流數十萬年。我們用詞語、聲音或動作進行交流並理解所說的內容,不僅是詞語、聲音或動作的意思,還有它們的上下文。我們 理解真誠和諷刺,允許相同的詞語根據我們的語氣表達不同的意思。
✅ 想一想你最近的一些對話。計算機理解這些對話有多困難,因為它需要上下文?
語言理解,也稱為自然語言理解,是人工智能領域的一部分,稱為自然語言處理(或 NLP),涉及閱讀理解,試圖理解詞語或句子的細節。如果你使用語音助手如 Alexa 或 Siri,你已經使用了語言理解服務。這些是將「Alexa,播放泰勒·斯威夫特的最新專輯」轉換為我女兒在客廳裡隨著她最喜歡的音樂跳舞的幕後 AI 服務。
💁 儘管計算機取得了很大的進步,但在真正理解文本方面仍有很長的路要走。當我們提到計算機的語言理解時,我們並不是指任何接近人類交流的東西,而是指提取關鍵細節的一些詞語。
作為人類,我們在不經意間理解語言。如果我要求另一個人「播放泰勒·斯威夫特的最新專輯」,他們會本能地知道我的意思。對於計算機來說,這更困難。它需要將詞語從語音轉換為文本,並找出以下信息:
- 需要播放音樂
- 音樂是由泰勒·斯威夫特演唱的
- 具體的音樂是一整張專輯,按順序播放多首曲目
- 泰勒·斯威夫特有很多專輯,所以需要按時間順序排序,最新發行的專輯是所需的
✅ 想一想你在提出請求時說過的一些其他句子,例如點咖啡或要求家人遞給你某物。試著將它們分解為計算機需要提取的信息片段,以理解句子。
語言理解模型是訓練從語言中提取某些細節的 AI 模型,然後使用遷移學習為特定任務進行訓練,就像你使用一小組圖像訓練自定義視覺模型一樣。你可以採用一個模型,然後使用你希望它理解的文本進行訓練。