中國汽車論壇丨呂思南：人工智能助力智能座艙體驗躍升

時間：2023-07-13 08:02 來源：蓋世汽車編輯：子墨閱讀量：14235

2023年7月5日-7日，由中國汽車工業協會主辦的第13屆中國汽車論壇在上海嘉定舉辦。本屆論壇以“新時代新使命新動能——助力建設現代化產業體系”為主題，設置“1場閉門峰會+1個大會論壇+16個主題論壇+N場發布”共18場會議及若干發布、展示、推廣等活動，旨在凝聚各方力量，形成發展共識，為建設現代化產業體系貢獻汽車行業的智慧和力量。其中，在7月7日下午舉辦的“主題論壇十三:聚能共創，加速構建軟件定義汽車新生態”上，科大訊飛股份有限公司智能汽車BU智能座艙副總經理呂思南發表精彩演講。

以下內容為現場演講實錄:

今天非常有幸能給大家介紹從科大訊飛的視角，從人工智能企業角度考慮如何為汽車行業提供有價值的技術方案，幫助汽車成為更好的、能感知人和服務人的產品。

每家車企都希望打造自己的品牌特性，構建獨立的產品規劃，我們認為，從差異化的角度來看，用戶可以從交互層面感受每個品牌的產品特點。人車交互包括語音輸入、視覺感知、針對乘客和駕駛員的不同服務，以及訊飛星火認知大模型給用戶帶來的人性化體驗。

我們要聚焦用戶在整車生命周期中面臨的一系列場景，包括如何買車、如何用車、如何日常維護，甚至最后將車輛出售，在這個過程中我們的產品應該提供什么樣的服務，去幫助、引導用戶，讓其不再有后顧之憂。

在服務方面，我相信每家車企并不僅僅專注于銷售收入，也要考慮為用戶提供長期服務。在車企和用戶之間，我們的產品可以通過生態、持續服務和日常活動來維持和用戶之間的聯系。

當前智能座艙行業存在的痛點包括為強行差異化而推出的噱頭式體驗，不能提供整體閉環服務，在宣傳上羅列個別特色功能等，這些缺陷讓用戶在使用車輛時無所適從，需要打造更便捷的用車方式，通過將人工智能賦能人車交互，讓用戶體驗更方便、更簡單、更有趣味的汽車生活。在這個過程中，科大訊飛可以利用長期積累的人工智能技術，與不同行業進行匹配。幫助解決智能座艙研發周期長、量產即過時等一系列問題。為大家提供用以持續升級、不斷迭代的通道。

科大訊飛主推“情景智能座艙”。“情”，就是要有更好的用戶感知，輕松的跟用戶進行場景化交互，在用戶想要的時候出現在用戶的面前，為用戶提供細致入微的服務。“景”想做的是基于不同用車場景打造不同深度的交互體驗。這對于用戶在車里的導航通信，日常出行中的打發時間等方面是非常有必要的。在整個汽車行業，沒有人會愿意在必要性場景的開發上落后于人，至少是要達到中等或中等偏上的水平。現在很多新能源車企都期望打造自己專屬的車內休憩空間，以及寵物關懷場景。在沉浸式場景中如何做到真正的體貼，觸及用戶所求，打動用戶內心，最終形成用戶對品牌的粘性。這些方面確是我們目前需要一起思考的。還有驚喜型場景，用以記錄車主用車時遇到的特殊情況。前幾天我看到網上一個視頻，一個特斯拉車主分享了他的車在哨兵模式下記錄了別人拔充電槍的畫面。不像傳統油車加油僅需一兩分鐘，充電補能時間較長的新能源車，哨兵模式是剛需。在未來新能源車會越來越多，哨兵模式能更好的幫助車主完成充電。

“情”和“景”都需要從智能的方式為用戶提供服務，打通用戶需求，打動用戶心理。科大訊飛提供的人工智能服務能給各方帶來很大的幫助。如何在汽車中實現AI能力的快速迭代？這是目前汽車智能化進程中遇到的重要關卡。通過觀察已經上市的車型，各大廠商在交互層面已經做了很多努力。現在不同車型都有自己定制的語音理解能力，但很多時候定制語音依然不能滿足用戶的需求。在面向客戶交付的過程中，各方都提出了自己需要的特色功能和能力，然而車機系統實際分析語音時，用戶端會產生非常多的需求偏差及個性化需求。要真正讓設備、機器、汽車理解用戶，我們還有很多路要走。

今年，科大訊飛發布了訊飛星火認知大模型，為有效解決人車交互痛點，引導人車交互向類人化交互體驗進化，訊飛星火認知大模型從場景出發，帶來了多樣化的定制解決方案。

首先，在車艙中實現真正的“自由說”。人機交互的舊方法是用通配，包括表達式、文法在內的各種技術，實現全部自然語言的支持，并把支持不了的話語用兜底話術進行回應，即使用好兜底話術可以減少用戶的反感，但實際上車并沒有幫用戶完成他真實的訴求。

“自由說”要支持多輪多意圖交互理解，在現有系統中補充大量通用知識、專用知識，包括日常生活知識，汽車養護、汽車使用的知識等，跨場景業務也要實現融合。日常對話中大家經常會聊到不同的主題，從A主題聊到B主題，從B主題聊到C主題，甚至從C主題聊完以后再回來聊，這對于人類來說是正常的對話，但是車卻不理解，這個問題我們用下一代技術可以解決。下一代座艙中，“自由說”要支持全部的語義理解、上下文貫穿理解，而不是有限的只能記得幾輪對話前的內容，并且車機系統可以用擬人化的方式和用戶交互，這里的“擬人化”并不是簡單的話語上的客氣、相敬如賓，而是有情感、有情緒的對話，在車內要配合系統3D形象，帶有表情和肢體動作，和用戶進行交互，達到像人類伙伴一樣的智能交流。

智能系統要懂汽車，知道車上有什么能力，知道它能做什么，知道這輛車應該如何呈現車企對用戶的關懷。此外它還要有開放擴展的能力，不管是生態的信息源，還是日常OTA過程中持續添加的內容。它都可以持續的開放、擴展，并且能夠方便的對接。

我們要在車內要做到快速交互體驗，包括輸入、響應，此外要做全鏈路優化，使車的反應更加敏捷，只有反應夠快，用戶才能感受到車輛是在積極地向他服務。另外，要從多模態來感知用戶，知道用戶在車里的狀態是什么，是前排乘客在問你，還是后排乘客在問你，你要對誰服務，這些都是車輛在向客戶提供服務時的關鍵信息，比如說后排乘客在睡覺時，駕駛員想問導航信息，車輛應該小聲說話。這都是車輛在視覺層面應該要感知到的。

融合手勢等輸入的交互方法可以實現系統級的打通，在車內各個應用里統一交互方式，讓用戶不會因為交互能力在不同應用里打通深度不同而感到困惑。同時，在向用戶呈現結果的時候要更加豐富，以聲音為例，車里的音箱除了能給大家帶來很好的音樂體驗，也可以給大家帶來多維度的信息感知，就像一開始零束的專家說到的，要在車內實現用戶對方向的感知，用戶在車內提出需求后，肯定是希望得到對應的、就近的反饋，而不是把他的需求廣而告之。我們現在為用車場景提供了多種聲音能力，包括音效的渲染能力、多分區服務能力。另外，還可以為大家設計個性化音效定制，讓用戶一上車就能感受到品牌的專屬服務。

AI能力的貫通并不是單純軟件層面的問題，剛才大家提到了需要融合操作系統，需要做硬件的抽象化。這部分當然是需要解決的，現在在嵌入式端的算力上還是存在一些問題。以AI算力為例，目前沒有哪一家的硬件方案里可以統一NPU部分和AI計算，我們需要適度針對當前硬件平臺進行定制和優化，最終擁有全鏈交付的能力，讓端、云實現更高性能更高性價比的服務。

科大訊飛從去年加入到大模型競爭行列后，在今年5月6日正式發布了大模型產品，為什么我們能這么快？這是因為科大訊飛在長期的發展中，建立了龐大的知識體系。2017年，訊飛人工智能參加國家執業醫師資格等級考試，自主閱讀題目并回答，最終通過了考試；在機器閱讀理解方面的持續演進，使得我們可以用一個通用的認知模型，為教育、辦公、汽車等領域提供深度服務。

訊飛星火認知大模型可以提供多風格、多任務、長文本的生成能力，汽車可以扮演不同的角色，擁有跨語種的語言理解能力，綜合上下文理解用戶的意圖。在知識問答之外，大模型可以回答很多問題，像是邏輯推理、數學計算、生成代碼，并不是所有的大模型功能都要上車，而是因為有了大模型能力的支撐，人車交互體驗可以變得更好。

科大訊飛在5月6日發布星火大模型以后，會在6月9日、8月15日以及10月24日全球開發者節持續更新大模型產品，特別是在今年10月24日，訊飛星火認知大模型要在中文方面超越ChatGPT，在英文方面保持同等水平，這是我們對行業、對市場的承諾。

汽車方面，要融合多輪對話貫穿理解能力，知識理解和知識應用的能力，能夠實現和用戶進行閑聊對話，開導、安撫用戶，實現共情，完成較長鏈業務自動引導回復，對于新知識、汽車相關知識持續學習，基于用戶意見進行修改。

車上的認知大模型并不是單純以語音輸入為中心的大模型，而是結合用戶的使用場景、使用環境，給用戶提供更貼心的服務。在車輛有座椅通風功能時，如果用戶表達希望讓身體更涼快，車輛應該自動把通風功能打開。而對于另一輛只有空調制冷的車，系統只會打開空調，現在有了大模型知識能力后，車輛可以自主幫用戶進行判斷，向用戶推薦不同的沉浸式空間和場景。我們在今年會推出星火智能座艙產品，以平臺化為全行業提供大模型能力，既包括了在交互層面豐富大模型服務，也可以開放大模型的潛在能力，供各個應用直接調度使用。

在座艙中要如何提供K歌、休息沉浸化的服務？用戶在拿起麥克風唱歌時，既可以演唱歌曲，通過車載音響獲得最佳聽感，也可以與系統進行交互，用戶不再需要把麥克風放下來說喚醒詞，操作麥克風就可以完成切歌、聽歌等操作。打造休息空間需要聯動整車能力，車輛自動記憶用戶認為舒適的位置，記錄下來，方便用戶下次體驗。當然，如果休息的時間到了，會用鬧鐘把用戶叫起，這些操作都可以通過語音控制。車輛還可以營造特色的兒童空間，有針對兒童的交互模式，可以很好地聽懂孩子的話語，另外可以提供教育、音樂、辦公等一系列服務，滿足用戶在車上的商務需求、家用需求。這些場景、空間、車輛控制的能力、SOA原子化能力都可以通過場景串接起來，供用戶自主定義。這些產品能力，我們期望和那些力求自研的、或是使用整體方案的伙伴都能深度合作，產品全部的能力都可以通過組件化的方式，甚至是更深度的方式進行交付，滿足大家自由定義和選擇。

人工智能助力智能座艙，需要在智能域控、人機交互、軟件服務方面搭建不同層級的平臺，以滿足大家獲取平臺化能力的需求。在人工智能方面，我們會為大家提供全套座艙在音頻、視覺等方面的閉環感知能力。大家既可以自己進行組合，也可以使用成套解決方案。當然，我們還會提供評價體系，幫助大家更好地持續優化自己的產品。

科大訊飛可以協助大家完成座艙方案的分層介紹，包括軟件交付形式，產品咨詢與參考，硬件相關的選擇。在云端，我們可以為客戶提供交互、運營、生態的知識圖譜服務及推薦服務，便于大家搭建自己的服務體系。在最終的硬件方面，我們也能為大家做客戶端的全量設計和咨詢服務。不管是由車企自己研發硬件，還是由Tier1研發硬件，我們都可以做相關的支持，AI和硬件搭配、AI算法落地方面是我們的專長，我們期望為大家提供資深的服務。

對于智能座艙而言，有智能交互解決方案，智能座艙軟件硬件解決方案，還有音頻音效方面的解決方案，他們構成了訊飛智能座艙綜合解決方案整體。此外，我們正在智能駕駛方向進行研究，希望能將座艙交互和車輛駕駛深度打通，為大家營造更好的智能出行體驗。

謝謝大家！

鄭重聲明：此文內容為本網站轉載企業宣傳資訊，目的在于傳播更多信息，與本站立場無關。僅供讀者參考，并請自行核實相關內容。