139-1008-4168

首頁(yè) > SEO動(dòng)態(tài) > 網(wǎng)站技術(shù)別認(rèn)為對(duì)話(huà)式交互是進(jìn)步！詳解對(duì)話(huà)式交互的6大缺點(diǎn)

別認(rèn)為對(duì)話(huà)式交互是進(jìn)步！詳解對(duì)話(huà)式交互的6大缺點(diǎn)

2024-09-06 08:03:42

推薦訪(fǎng)問(wèn)：SEO新聞 SEO技術(shù) 網(wǎng)站技術(shù) 網(wǎng)絡(luò)營(yíng)銷(xiāo)

最近兩年很多 AI 產(chǎn)品出現(xiàn)之后都采用了對(duì)話(huà)式（Chat）的形式。導(dǎo)致很多人認(rèn)為對(duì)話(huà)形式（Chat）交互相對(duì)于常見(jiàn)的圖形化界面是一種進(jìn)步。事實(shí)并非如此。

這種錯(cuò)誤認(rèn)知可能因?yàn)榘?AI 技術(shù)與對(duì)話(huà)式交互畫(huà)上了等號(hào)，在看到 AI 技術(shù)迅猛發(fā)展的時(shí)候。就同樣認(rèn)為對(duì)話(huà)式更優(yōu)秀。

但這種交互形式被眾多 AI 產(chǎn)品使用的原因只是因?yàn)檫@一波 AI 浪潮最大的技術(shù)進(jìn)步是大語(yǔ)言模型。而大語(yǔ)言模型的核心功能之一就是生成內(nèi)容。加上 OpenAI 最早使用了這種形式被后來(lái)者效仿。

在 2017 年前后上一波 AI 浪潮中，主要的技術(shù)發(fā)展方向是計(jì)算機(jī)視覺(jué)，像人臉識(shí)別、自動(dòng)駕駛、OCR 等等都是基于計(jì)算機(jī)視覺(jué)技術(shù)衍生的。

由于其技術(shù)突破方向并非語(yǔ)言方向所以就沒(méi)有產(chǎn)生對(duì)話(huà)式形式，由此我們可以看出：對(duì)話(huà)式交互只是一個(gè)附屬形式并非更優(yōu)秀。

今天就詳細(xì)的講一下，對(duì)話(huà)式交互和圖形化界面相比有哪些缺點(diǎn)。

一、操作效率

GUI 的操作過(guò)程其實(shí)是眼、手、預(yù)置信息等三方面協(xié)同，眼睛瞄準(zhǔn)、手點(diǎn)擊、預(yù)置信息觸發(fā)對(duì)應(yīng)操作，但在 Chat 形式中幾乎全部依賴(lài)手了，所以操作效率下降。

其實(shí)很多圖形化界面的交互形式點(diǎn)擊幾次就能解決的問(wèn)題使用對(duì)話(huà)形式可能需要多輪次、多描述才能完成，例如典型的訂外賣(mài)場(chǎng)景：

使用圖形化界面是這樣的：

別認(rèn)為對(duì)話(huà)式交互是進(jìn)步！詳解對(duì)話(huà)式交互的6大缺點(diǎn)

對(duì) 4 項(xiàng)不同的設(shè)置，只需要點(diǎn)擊 4 下就可以了，但如果使用 chat 的形式可能是這樣的：

系統(tǒng)：你要大杯還是小杯？

用戶(hù)：大杯

系統(tǒng)：零卡糖還是蔗糖？

用戶(hù)：0 卡糖

系統(tǒng)：正常糖量還是半糖？

用戶(hù)：正常糖

系統(tǒng)：熱的還是溫的還是冰的？

用戶(hù)：熱的

可以看出需要幾輪對(duì)話(huà)此案完成圖形化界面中 4 次點(diǎn)擊就能完成的操作，整體效率是很低的，這種形式也是非常真實(shí)的，不通過(guò)手機(jī)點(diǎn)單而是在門(mén)店直接下單店員真的需要把這些問(wèn)題都問(wèn)一遍。

但并非所有場(chǎng)景下 Chat 形式都比 GUI 形式低效，例如使用手機(jī)語(yǔ)音助手創(chuàng)建一個(gè)日程，可以退直接用語(yǔ)音指令：明天下午 3 點(diǎn)提醒我搶火車(chē)票，而不需要打開(kāi)某待辦 APP-點(diǎn)創(chuàng)建待辦按鈕-輸入待辦各個(gè)字段的文字-點(diǎn)擊保存。

所以還是存在一個(gè)臨界值，需要從點(diǎn)擊次數(shù)、路徑長(zhǎng)度、迷失度、可通訊通道場(chǎng)景等方面綜合衡量。

Chat 形式的每一次交互包含了操作+對(duì)象+修改內(nèi)容的具體描述，例如在修改代碼時(shí)，需要給出指令：增大登錄按鈕的寬度到 500PX，需要把 GUI 交互中修改方式、修改對(duì)象、修改數(shù)值等全部使用自然語(yǔ)言描述一遍，因此會(huì)降低操作效率。

二、操作歧義

由于操作過(guò)程完全依賴(lài)自然語(yǔ)言的描述，因此當(dāng)用戶(hù)輸入的文字不準(zhǔn)確、有錯(cuò)字、多含義時(shí)，可能產(chǎn)生錯(cuò)誤的結(jié)果。對(duì)用戶(hù)輸入準(zhǔn)確率的保證性較低。

出現(xiàn)錯(cuò)誤后還需要多加一輪對(duì)話(huà)進(jìn)行澄清，這又會(huì)進(jìn)一步影響操作效率。

例如，如果用戶(hù)想要搜索“蘋(píng)果的營(yíng)養(yǎng)價(jià)值”，但不小心打成了“萍果..”，AI 可能會(huì)將“萍果”理解為一個(gè)不常見(jiàn)或者不存在的詞匯，從而無(wú)法正確提供關(guān)于蘋(píng)果的營(yíng)養(yǎng)信息。或是給出與用戶(hù)期望不符的結(jié)果。

這是因?yàn)椤疤O(píng)果”是一個(gè)常見(jiàn)詞匯，而“萍果”可能不是，導(dǎo)致 AI 無(wú)法正確理解用戶(hù)的查詢(xún)意圖。

同樣的，作者真實(shí)的經(jīng)歷是在某電商平臺(tái)搜索「蘋(píng)果」結(jié)果顯示了一堆手機(jī)，其實(shí)作者本身是想買(mǎi)點(diǎn)紅富士吃吃。對(duì)于有多重含義的詞匯使用對(duì)話(huà)式交互就很容易出現(xiàn)這樣的問(wèn)題。

當(dāng)然我們可以通過(guò)更完整的描述來(lái)避免誤解，但輸入更完整的描述本身就是更高的操作成本了。

三、自我描述能力

GUI 形式會(huì)把產(chǎn)品的能力直接體現(xiàn)在用戶(hù)界面中，如搜索框、時(shí)間選擇器、下載等能力，Chat 形式最大的問(wèn)題是手續(xù)愛(ài)你需要用戶(hù)能想到，這一步就把產(chǎn)品設(shè)計(jì)時(shí)從要求產(chǎn)品變成了要求用戶(hù)，對(duì)產(chǎn)品清晰性的影響較大。

在下圖中用戶(hù)可以很清晰的知道某篇筆記能導(dǎo)出、且能以多種格式導(dǎo)出，但 Chat 的形式則需要用戶(hù)先想到。

別認(rèn)為對(duì)話(huà)式交互是進(jìn)步！詳解對(duì)話(huà)式交互的6大缺點(diǎn)

四、用戶(hù)習(xí)慣

工具需要細(xì)分，手指甲和腳指甲的剪刀都會(huì)細(xì)分，何況是各種大需求，微信里可以打車(chē)但滴滴 APP 的日活還有幾億。

想打破用戶(hù)的習(xí)慣需要并非不可以，但一定需要新方案的體驗(yàn)強(qiáng)于舊方案體驗(yàn)+遷移成本。

人類(lèi)會(huì)用自己習(xí)慣的方式解決問(wèn)題，路徑依賴(lài)會(huì)影響人類(lèi)在擁有多工具時(shí)的選擇，而 GUI 在過(guò)去的 10 年已經(jīng)為用戶(hù)形成了極強(qiáng)的操作習(xí)慣。

還有一些生活中下意識(shí)的習(xí)慣也會(huì)有影響，例如兩個(gè)對(duì)話(huà)時(shí)，往往不是只只針對(duì)唯一話(huà)題進(jìn)行多輪次對(duì)話(huà)，可能是兩三個(gè)主題并行的，此時(shí) AI 在理解時(shí)就會(huì)比較困難（因?yàn)槌霈F(xiàn)了一句與上下文無(wú)關(guān)的話(huà)）。

如果是在使用了多個(gè)模型/提示詞/agent 的產(chǎn)品中，這個(gè)問(wèn)題可能會(huì)更加明顯，因?yàn)樵谟脩?hù)在對(duì)話(huà)過(guò)程中切換話(huà)題時(shí)是否能馬上切換到其他模型/提示詞/agent 來(lái)回答無(wú)法確定。

五、能力精細(xì)度

即使模型能力范圍越來(lái)越大，但很難想象把所有應(yīng)用集中到一起會(huì)是什么樣子，分類(lèi)是人腦生理結(jié)構(gòu)決定的人處理任務(wù)/信息的方式。工具的 ALL in one 是個(gè)偽命題。

現(xiàn)在大多數(shù)通用 Chat，既能寫(xiě)代碼也能畫(huà)表格，但通用的結(jié)果一定是不夠精深，在細(xì)分能力是不夠強(qiáng)大。

還是以畫(huà)表格為例，通用 Chatbot 可以實(shí)現(xiàn)快速把數(shù)據(jù)填充到表格，但不一定能設(shè)置某行固定。更復(fù)雜的科學(xué)計(jì)算公式也無(wú)法實(shí)現(xiàn)。

以 WPS 為例，功能豐富到需要使用十幾個(gè)標(biāo)簽+每個(gè)標(biāo)簽下數(shù)十個(gè)子功能來(lái)呈現(xiàn)。

別認(rèn)為對(duì)話(huà)式交互是進(jìn)步！詳解對(duì)話(huà)式交互的6大缺點(diǎn)

難以想象使用通用 Chatbot 如何幫助用戶(hù)觸達(dá)這些功能，而這還只是一個(gè) WPS 中的功能點(diǎn)，所以作者堅(jiān)定的認(rèn)為工具產(chǎn)品的 All in one 是個(gè)偽命題。追求通用則一定在精細(xì)化能力上會(huì)有不足，就像我們?cè)O(shè)計(jì)師常用的設(shè)計(jì)規(guī)范，在追求通用性的同時(shí)面對(duì)不同業(yè)務(wù)場(chǎng)景的個(gè)性化能力就會(huì)被削弱。

六、多語(yǔ)言適配

在面對(duì)產(chǎn)品國(guó)際化、多語(yǔ)言適配的問(wèn)題中，圖形化用戶(hù)界面只需要把界面中出現(xiàn)的文字做翻譯即可，部分還可以使用圖標(biāo)替代更具通用性。

但大模型的輸入、輸出都使用了大量的文字，那么面對(duì)多語(yǔ)言是否能很好的支持是個(gè)問(wèn)題。

對(duì)于一些小語(yǔ)種，可能根本沒(méi)有足夠用于模型訓(xùn)練的數(shù)據(jù)量，那么模型就更加不可能提供優(yōu)質(zhì)服務(wù)了。

以上是對(duì)話(huà)式交互的 6 大缺點(diǎn)。下面再簡(jiǎn)單聊聊對(duì)話(huà)式交互的優(yōu)點(diǎn)，這一部分比較好理解就簡(jiǎn)單描述了：

① 易學(xué)性

對(duì)話(huà)式交互很直觀(guān)，用戶(hù)無(wú)需學(xué)習(xí)復(fù)雜的界面或命令，可以直接用自己的語(yǔ)言與系統(tǒng)交流。就像功能點(diǎn)非常多產(chǎn)品里面我們經(jīng)常找不到需要的功能在哪里一樣，對(duì)話(huà)式交互沒(méi)有這個(gè)問(wèn)題，因?yàn)椴恍枰趶?fù)雜的界面中尋找。但依然需要用戶(hù)已有「這個(gè)產(chǎn)品用這個(gè)功能」的認(rèn)知。

② 靈活性

用戶(hù)可以通過(guò)對(duì)話(huà)來(lái)表達(dá)繁瑣的命令，例如手機(jī)語(yǔ)音助手的一句話(huà)創(chuàng)建待辦，但要注意這里所說(shuō)的「繁瑣的命令」還不是「復(fù)雜的命令」，只能解決多步驟但每一步都比較簡(jiǎn)單的問(wèn)題。

圖形用戶(hù)界面中，用戶(hù)只能點(diǎn)擊到當(dāng)前顯示出來(lái)的元素（如按鈕），操作依賴(lài)屏幕可顯示范圍，但對(duì)話(huà)式交互沒(méi)有這個(gè)問(wèn)題，因?yàn)橐呀?jīng)用「描述」代替了屏幕中必須顯示出來(lái)的功能。

③ 設(shè)備適應(yīng)性強(qiáng)

對(duì)話(huà)式交互可以很容易地集成到移動(dòng)設(shè)備、智能揚(yáng)聲器或其他物聯(lián)網(wǎng)設(shè)備中，只要設(shè)備有麥克風(fēng)、揚(yáng)聲器、處理器即可滿(mǎn)足基本的對(duì)話(huà)式交互（這里特指語(yǔ)音交互了），減少了屏幕在設(shè)備中的成本。

這方面的實(shí)例已經(jīng)非常多了，就像小米的智能音箱，還有商場(chǎng)中的服務(wù)機(jī)器人。

④ 擴(kuò)展性

可以添加新的功能和服務(wù)，而用戶(hù)無(wú)需下載更新或?qū)W習(xí)新的交互方式。正式因?yàn)闆](méi)有圖形界面的限制，在增加功能時(shí)也不需要考慮界面顯示能力，不需要像 GUI 時(shí)代一樣因?yàn)榭臻g只能擺放有限個(gè)入口而爭(zhēng)來(lái)爭(zhēng)去了。

但這一點(diǎn)同樣會(huì)帶來(lái)曝光率的問(wèn)題，因?yàn)槟芰Φ臄U(kuò)展對(duì)用戶(hù)來(lái)說(shuō)是隱形的過(guò)程，即使使用新版本功能引導(dǎo)也只能被用戶(hù)看到一次（其實(shí)大概率一次都看不到就點(diǎn)擊關(guān)閉了）。

而不像 GUI 那樣有一個(gè)固定的位置顯示，經(jīng)常能被用戶(hù)看到。

以上是對(duì)話(huà)式交互的優(yōu)點(diǎn)，要注意以上內(nèi)容并非語(yǔ)音交互哦，討論范圍大概還是限定在文字對(duì)話(huà)形式的范圍內(nèi)。

作者：AI與用戶(hù)體驗(yàn)

想了解更多網(wǎng)站技術(shù)的內(nèi)容，請(qǐng)?jiān)L問(wèn)：網(wǎng)站技術(shù)

本文來(lái)源：http://gagu89.com/seodongtai/20079.html

免責(zé)聲明：部分文章信息來(lái)源于網(wǎng)絡(luò)以及網(wǎng)友投稿，本網(wǎng)站只負(fù)責(zé)對(duì)文章進(jìn)行整理、排版、編輯，是出于傳遞更多信息之目的，并不意味著贊同其觀(guān)點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性，不承擔(dān)任何法律責(zé)任。