Ban biên tập Verke

AI có thể bịa ra lời khuyên sai không? Có — đây là cách nhận biết và xử lý

Ban biên tập Verke ·

AI có thể bịa ra lời khuyên sai không? Có. Các mô hình ngôn ngữ lớn đôi khi tạo ra những thứ nghe rất hợp lý — một nghiên cứu không tồn tại, một trích dẫn sai, một lời khuyên không phù hợp với hoàn cảnh của bạn, một khung lý thuyết nghe tự tin nhưng hoàn toàn được bịa ra. Bối cảnh coaching có rủi ro thấp hơn so với y tế hay pháp lý, nhưng lời khuyên sai vẫn quan trọng. Phiên bản trung thực của bài viết này là: các lớp bảo vệ giúp giảm ảo giác nhưng không loại bỏ được hoàn toàn, và khả năng tự hiệu chỉnh của người dùng là một phần của những gì giúp một công cụ AI coaching tốt vẫn hữu ích.

Bài viết này đi qua những nơi ảo giác xuất hiện, cách Verke được thiết kế để chặn các nhóm rủi ro cao, và cách bạn hiệu chỉnh mức độ tin cậy với tư cách người dùng — đại khái là "hãy xem gợi ý của AI như lời khuyên từ một người bạn thông minh nhưng không phải biết tuốt". Tư thế của Verke là thà nói "tôi không chắc" còn hơn tự tin nhưng sai, và giữ cho coaching hướng đến khám phá thay vì chẩn đoán. Không điều nào trong số đó khiến ảo giác trở thành bất khả thi. Nhưng nó giúp các kiểu lỗi dễ nhận ra và các bước phục hồi trở nên đơn giản.

"Ảo giác" nghĩa là gì

Các mô hình ngôn ngữ bịa như thế nào

Mô hình ngôn ngữ dự đoán văn bản tiếp theo có xác suất cao nhất dựa trên các mẫu trong dữ liệu huấn luyện. Phần lớn thời gian, văn bản tiếp theo có xác suất cao nhất cũng chính là văn bản đúng — đó là lý do những công cụ này hoạt động tốt như vậy. Nhưng đôi khi, văn bản tiếp theo có xác suất cao nhất lại sai. Mô hình đưa ra một câu trả lời nghe có vẻ tự tin nhưng không có cơ sở thực tế. Điều khiến người ta bối rối chính là sự trôi chảy: câu trả lời sai đọc lên mượt mà chẳng kém gì câu trả lời đúng, vì nhiệm vụ của mô hình là tạo ra văn bản trôi chảy, không phải văn bản đã được kiểm chứng.

Đây không phải nói dối — mô hình không có ý đồ, không có mục tiêu, không có ý định lừa gạt. Đó chỉ là vì mô hình không có một thành phần "sự thật" riêng để đối chiếu đầu ra với thực tế trước khi tạo ra nó. Các kỹ thuật mới hơn (truy xuất, sử dụng công cụ, kiểm tra tự nhất quán, huấn luyện từ chối) giúp giảm ảo giác đáng kể, và tỷ lệ này tiếp tục giảm sau mỗi thế hệ mô hình. Tuy vậy chúng không loại bỏ được hoàn toàn. Xem đầu ra của AI như "hầu hết là đúng, nhưng cần xác minh những phần quan trọng" là cách hiệu chỉnh phù hợp cho hôm nay và có lẽ cho vài năm tới.

Đang phân vân không biết có nên tin lời khuyên bạn đang nhận được không?

Thử một bài tập CBT cùng Judith — 2 phút, không cần email.

Trò chuyện với Judith →

Ảo giác xuất hiện ở đâu trong coaching

Trích dẫn bịa ra

Hình dạng ảo giác kinh điển: "một nghiên cứu Harvard năm 2019 đã phát hiện ra…" rồi đến một kết luận nghe tự tin mà khi bạn đi tra cứu thì không hề tồn tại. Bài báo được bịa ra; tác giả được bịa ra; tên tạp chí có thể có thật nhưng bài báo thì không. Cách khắc phục là xác minh bất kỳ trích dẫn nào quan trọng với bạn qua PubMed hoặc Google Scholar trước khi tin cậy. Nếu có URL, hãy bấm vào và kiểm tra xem phần tóm tắt có thực sự nói đúng những gì được trích dẫn — đôi khi URL có thật nhưng bản tóm tắt gắn kèm lại sai.

Lời khuyên y tế hay pháp lý cụ thể

Liều thuốc, tương tác thuốc, quy định pháp lý theo khu vực, các thủ tục pháp lý cụ thể — bất cứ điều gì mà câu trả lời cần phải chính xác tuyệt đối, nếu không sẽ gây hại. Ngay cả khi câu trả lời của mô hình tình cờ đúng, đây vẫn là công cụ sai cho những câu hỏi như vậy, vì bạn không có cách nào biết được lần này nó có đúng hay không. Hãy luôn xác minh với chuyên gia có giấy phép hành nghề (bác sĩ, dược sĩ, luật sư, kế toán) cho bất cứ điều gì có thể hành động trong những lĩnh vực đó. Các coach của Verke được thiết kế để từ chối thẳng những câu hỏi này thay vì ứng biến — xem phần tiếp theo.

Câu trả lời tự tin trong những lĩnh vực hẹp

Các tình trạng hiếm gặp với dữ liệu huấn luyện thưa thớt, các quy định khu vực mà phần lớn thế giới chẳng quan tâm, tên cụ thể của các nhà trị liệu, các cộng đồng chuyên môn nhỏ. Mô hình có vừa đủ mẫu trong dữ liệu huấn luyện để tạo ra thứ gì đó trôi chảy, nhưng không đủ để biết nó có đúng hay không. Sự kết hợp giữa trôi chảy và hẹp là tín hiệu chính — khi chủ đề ít người biết nhưng câu trả lời lại tự tin, đó là lúc cần hiệu chỉnh.

Khung lý thuyết nghe hợp lý nhưng sai

Những "phương pháp năm bước" và "bốn trụ cột của…" được bịa ra mà không hề tồn tại trong tài liệu chuyên ngành. Mô hình đã thấy đủ cấu trúc kiểu self-help để tạo ra những phiên bản trông thuyết phục, ngay cả khi khung cụ thể mà nó đang mô tả là bịa ra. Nếu một khung lý thuyết nào đó quan trọng với quyết định của bạn, hãy tra tên tác giả hoặc tên phương pháp để xác nhận nó có thật trước khi xem như thực hành chuẩn. Những khung lý thuyết thật có trang Wikipedia, sách và trích dẫn thật; những cái bịa ra thì không.

Chúng tôi làm gì với chuyện đó

Verke làm gì với chuyện đó

Lớp bảo vệ theo lĩnh vực

Các coach được thiết kế để từ chối những nhóm rủi ro cao thay vì ứng biến. Liều thuốc, tương tác thuốc, ý kiến pháp lý, các tuyên bố chẩn đoán, bất cứ điều gì lấn sang lãnh địa của chuyên gia có giấy phép — phản hồi sẽ là chuyển hướng thay vì cố trả lời. "Câu này nghe có vẻ là câu hỏi dành cho dược sĩ" là một tính năng, không phải hạn chế. Sản phẩm thà không trả lời còn hơn trả lời sai.

Kỷ luật trích dẫn

Khi một coach dẫn chiếu một nghiên cứu hay một phương pháp, trích dẫn sẽ kèm theo một URL thật mà người dùng có thể xác minh (bài StopOverthinking trên trang này trích dẫn A-Tjak và cộng sự 2015 kèm link PubMed chính vì lý do đó — người đọc cần bấm qua được để kiểm tra). Nếu coach không thể trích dẫn một cách kiểm chứng được, cách diễn đạt sẽ chuyển sang "có bằng chứng cho thấy" hoặc "đây là một khuôn mẫu phổ biến trong ngành", chứ không phải các chi tiết bịa ra. Tiêu chuẩn là "người đọc có thể xác minh điều này trong 30 giây".

Mặc định thận trọng

Khi mức độ nghiêm trọng được hé lộ trong cuộc trò chuyện, động thái mặc định là đưa lên dịch vụ chăm sóc lâm sàng thay vì ứng biến giúp đỡ. Các chủ đề liên quan đến khủng hoảng được chuyển hướng đến các nguồn lực hỗ trợ khủng hoảng. Các chủ đề liên quan đến chẩn đoán được chuyển hướng đến bác sĩ lâm sàng. Sản phẩm được thiết kế để nghiêng về phía "hãy mang chuyện này đến với một con người" khi rủi ro cao — đây cũng chính là nơi ảo giác sẽ gây thiệt hại lớn nhất nếu lọt qua.

Bạn có thể làm gì với tư cách người dùng

Hiệu chỉnh là việc của cả hai bên. Sản phẩm làm phần của nó bằng các lớp bảo vệ và kỷ luật trích dẫn; phần của người dùng là vài thói quen đơn giản giúp giảm thiểu thiệt hại khi ảo giác có xảy ra:

  • Hãy xem gợi ý của AI như lời khuyên từ một người bạn thông minh nhưng không biết tuốt. Một điểm khởi đầu hữu ích, không phải lời cuối cùng.
  • Hãy xác minh trích dẫn trước khi chia sẻ hay hành động theo. PubMed và Google Scholar chỉ mất 30 giây để kiểm tra.
  • Hãy hỏi "bạn tự tin đến mức nào về điều này?" — đôi khi mô hình có thể báo hiệu sự không chắc chắn khi được hỏi, và câu trả lời đó rất đáng tham khảo.
  • Với bất cứ điều gì liên quan đến y tế, pháp lý hay tài chính — hãy xác minh với một người có giấy phép hành nghề. AI là công cụ sai cho những lĩnh vực này khi dùng làm nguồn chính.
  • Khi điều gì đó không phù hợp với hoàn cảnh của bạn, hãy phản hồi lại. Câu trả lời sẽ được hiệu chỉnh lại quanh những gì bạn vừa bổ sung — lời khuyên chung chung thường là dấu hiệu cho thấy coach chưa nắm rõ chi tiết cụ thể của bạn.

Khi nào cần tìm thêm hỗ trợ

Self-help và AI coaching có thể giúp được nhiều, nhưng vẫn có giới hạn. Nếu bạn đang trải qua trầm cảm nặng kéo dài chưa thuyên giảm, các cơn hoảng loạn làm gián đoạn sinh hoạt hằng ngày, ý nghĩ tự làm hại bản thân, đang xử lý sang chấn, hoặc lệ thuộc chất gây nghiện — đó là tín hiệu để làm việc với một chuyên gia lâm sàng có giấy phép, chứ không phải tín hiệu để ép mình dùng công cụ coaching mạnh hơn. Bạn có thể tìm các lựa chọn chi phí thấp tại opencounseling.com hoặc các đường dây trợ giúp quốc tế qua findahelpline.com. Không có phần thưởng nào cho việc chờ lâu hơn mức cần thiết.

Làm việc với Judith

Hiệu chỉnh — "suy nghĩ này (hoặc lời khuyên này) có thực sự đúng không?" — là cốt lõi của CBT. Cách tiếp cận của Judith xem niềm tin như những giả thuyết cần kiểm tra, chứ không phải sự thật cần nuốt trọn, và đây chính là tư thế giúp bạn sử dụng bất kỳ nguồn thông tin nào (kể cả AI coach) mà không quá tin tưởng. Cô ấy cũng giỏi ở phiên bản meta: nhận ra khi bạn đang dựa quá nhiều vào một nguồn duy nhất — sách, podcast, bạn bè, ứng dụng — và kéo bạn trở lại với phán đoán của chính mình như bộ lọc cuối cùng. Để tìm hiểu thêm về phương pháp, xem Cognitive Behavioral Therapy.

Thử một bài tập CBT cùng Judith — không cần tài khoản

Câu hỏi thường gặp

Câu hỏi thường gặp

Tại sao AI đôi khi bịa ra mọi thứ?

Các mô hình ngôn ngữ lớn dự đoán văn bản có xác suất cao, không phải sự thật đã được kiểm chứng. Chúng lấp đầy những khoảng trống nghe có vẻ hợp lý khi không có thông tin được neo chắc — một câu trả lời nghe tự tin nhưng không có cơ sở thực sự. Đây không phải nói dối (mô hình không có ý đồ gì); đó là vì mô hình không có một thành phần "sự thật" riêng để tự đối chiếu. Các lớp bảo vệ mới hơn giúp giảm điều này nhưng không loại bỏ được hoàn toàn.

Ảo giác có nguy hiểm trong coaching không?

Thường là rủi ro thấp khi chủ đề mang tính chiêm nghiệm — gọi tên cảm xúc, khám phá các khuôn mẫu, tập dượt cuộc trò chuyện. Rủi ro cao hơn khi chủ đề liên quan đến chi tiết y tế, pháp lý hay tài chính, nơi câu trả lời sai dẫn đến hành động sai. Hãy điều chỉnh nỗ lực xác minh theo mức độ rủi ro: một cảm giác về đồng nghiệp không cần kiểm tra dữ kiện; một tuyên bố về tương tác thuốc thì có.

Làm sao tôi biết khi nào AI đang bịa?

Câu trả lời tự tin trong những lĩnh vực hẹp là dấu hiệu rõ ràng nhất — các tình trạng hiếm gặp, quy định địa phương, tên cụ thể của các nhà trị liệu. Trích dẫn bạn không thể kiểm chứng, "nghiên cứu" không tìm thấy URL, và các chi tiết y tế không có cảnh báo cũng đáng nghi ngờ hơn. Ngôn ngữ càng trau chuốt và bóng bẩy thì càng cần kiểm chứng; trôi chảy không phải là chính xác.

Tôi có nên kiểm tra dữ kiện những gì AI nói với mình không?

Với bất cứ điều gì cần hành động trong đời thực — có. Kiểm tra dữ kiện chỉ mất 30 giây với một công cụ tìm kiếm. Với cuộc trò chuyện chiêm nghiệm về trải nghiệm của chính bạn, điều đó ít quan trọng hơn vì bạn mới là nguồn sự thật. Tách bạch đại khái là: các tuyên bố bên ngoài (con số, trích dẫn, quy định) cần xác minh; sự khám phá nội tâm (bạn đang cảm thấy gì, bạn muốn thử điều gì) thì không.

Có phải một số AI coach chính xác hơn những coach khác?

Độ chính xác phụ thuộc vào mô hình nền tảng, các lớp bảo vệ mà sản phẩm bọc quanh nó, và mức độ thu hẹp phạm vi của coach. Những coach được xây dựng dựa trên các phương pháp đã được nghiên cứu kỹ và có bằng chứng (CBT, ACT, PDT) thường ít trôi dạt hơn so với coach kiểu mở, vì tài liệu nguồn có cấu trúc và được lập bản đồ rõ ràng. Các coach của Verke được thu hẹp theo phương pháp chính là vì lý do này.

Verke cung cấp coaching, không phải trị liệu hay chăm sóc y tế. Kết quả khác nhau tùy mỗi người. Nếu bạn đang trong khủng hoảng, hãy gọi 988 (Mỹ), 116 123 (Anh/EU, Samaritans), hoặc dịch vụ cấp cứu địa phương. Truy cập findahelpline.com để biết các nguồn hỗ trợ quốc tế.