專家實測6大AI工具可靠度 榜首出人意料
現在人碰到問題,第壹直覺反應就是問 AI!但是到底哪壹個 AI 工具才最准確?或許每個人都有不壹樣的感受,對此英國消費者組織《Which?》就聯合專家,針對六組常見的 AI 工具進行實測,結果 Gemini、ChatGPT 都無法獲得最高分。
《Which?》針對 ChatGPT、Google Gemini、Gemini AI Overview (Google 搜尋的 AI 摘要)、Microsoft Copilot、Meta AI 及 Perplexity 等六個工具進行測試,每個 AI 會被詢問包含個人理財、法律、健康與飲食、消費者權益及旅游等不同面向、共 40 個問題,再由專家確認准確度、清晰度、實用性、倫理責任等指標,進而給出整體評分,結果如下(分數越高越好):
1.Perplexity:71%
2.Gemini AIO:70%
3.Gemini 69%
4.Copilot:68%
5.ChatGPT:64%
6.Meta AI:55%
調查發現,AI 給予的答案存在許多隱憂,例如許多來源引用 Reddit 論壇或未知網站,並非來自權威內容,甚至有的 AI 會提供錯誤的理財、醫療資訊。當旅游碰到意外時,它甚至可能誤導取消機票可以全額退費,或是對於票務規則本身就有錯誤理解,在法律上的專業度也明顯不足,沒有提醒消費者應該征詢專業的法律建議。
《Which?》科技專家 Andrew Laughlin 指出:“我們的研究發現,AI 有太多令人不安且不准確的誤導性陳述,尤其是在碰到財務、法律諮詢等重要議題時。”他警告用戶,使用 AI 務必明確定義問題,並且仍要檢查資訊來源,對於醫療、財務等復雜議題,壹定要尋求專業諮詢後,再做出重大決定。

(示意圖)
[物價飛漲的時候 這樣省錢購物很爽]
好新聞沒人評論怎麼行,我來說幾句
《Which?》針對 ChatGPT、Google Gemini、Gemini AI Overview (Google 搜尋的 AI 摘要)、Microsoft Copilot、Meta AI 及 Perplexity 等六個工具進行測試,每個 AI 會被詢問包含個人理財、法律、健康與飲食、消費者權益及旅游等不同面向、共 40 個問題,再由專家確認准確度、清晰度、實用性、倫理責任等指標,進而給出整體評分,結果如下(分數越高越好):
1.Perplexity:71%
2.Gemini AIO:70%
3.Gemini 69%
4.Copilot:68%
5.ChatGPT:64%
6.Meta AI:55%
調查發現,AI 給予的答案存在許多隱憂,例如許多來源引用 Reddit 論壇或未知網站,並非來自權威內容,甚至有的 AI 會提供錯誤的理財、醫療資訊。當旅游碰到意外時,它甚至可能誤導取消機票可以全額退費,或是對於票務規則本身就有錯誤理解,在法律上的專業度也明顯不足,沒有提醒消費者應該征詢專業的法律建議。
《Which?》科技專家 Andrew Laughlin 指出:“我們的研究發現,AI 有太多令人不安且不准確的誤導性陳述,尤其是在碰到財務、法律諮詢等重要議題時。”他警告用戶,使用 AI 務必明確定義問題,並且仍要檢查資訊來源,對於醫療、財務等復雜議題,壹定要尋求專業諮詢後,再做出重大決定。

(示意圖)
[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: |
推薦:
專家實測6大AI工具可靠度 榜首出人意料