Cách các nhà nghiên cứu vượt qua phát hiện AI (mà không gian lận)
Một cái nhìn thực tế về cách các nhà nghiên cứu học thuật xử lý các công cụ phát hiện AI. Đề cập đến Turnitin, GPTZero, các trường hợp dương tính giả và các phương pháp nhân hóa hợp pháp.
Một giáo sư tại Đại học Michigan đã cho bài báo đã xuất bản của mình — được viết hoàn toàn bằng tay vào năm 2019 — chạy qua GPTZero vào năm ngoái. Nó đã đánh dấu 41% văn bản là do AI tạo ra.
Cô ấy không sử dụng AI. Không có cả một trình kiểm tra ngữ pháp. Bài báo được viết trên một chiếc laptop trong một quán cà phê trong ba cuối tuần.
Đây là vấn đề dương tính giả, và đó là lý do hàng nghìn nhà nghiên cứu đang tìm cách xử lý phát hiện AI trong viết học thuật — không phải vì họ gian lận, mà vì các công cụ phát hiện không đáng tin cậy.
Cách Turnitin, GPTZero và Copyleaks thực sự phát hiện văn bản AI
Các công cụ phát hiện AI hoạt động bằng cách đo lường các thuộc tính thống kê của văn bản. Chúng không hiểu những gì bạn đã viết. Chúng đo lường cách bạn đã viết nó.
Chỉ số cốt lõi là perplexity — một thước đo về mức độ bất ngờ của mỗi lựa chọn từ ngữ dựa trên ngữ cảnh trước đó. Các nhà văn con người sản xuất văn bản với độ biến thiên perplexity cao. Chúng tôi sử dụng những từ không ngờ, thay đổi nhịp điệu giữa đoạn văn, và đưa ra những lựa chọn mà một mô hình ngôn ngữ sẽ không dự đoán được.
Văn bản do AI tạo ra có độ perplexity thấp. Mỗi từ là token tiếp theo có xác suất thống kê cao nhất. Các câu thường có độ dài tương tự nhau. Các chuyển tiếp theo các chuỗi có thể dự đoán.
Mô-đun phát hiện AI của Turnitin sử dụng một mô hình độc quyền được đào tạo trên hàng triệu bài nộp của sinh viên. GPTZero sử dụng sự kết hợp của perplexity và điểm burstiness. Copyleaks chạy nhiều bộ phân loại và trả về tỷ lệ tự tin.
Tất cả chúng đều chia sẻ cùng một hạn chế cơ bản: chúng đang đưa ra một dự đoán xác suất. Không phải là một xác định chắc chắn.
Tại sao các công cụ phát hiện AI đánh dấu văn bản do con người viết (dương tính giả)
Dương tính giả xảy ra thường xuyên hơn so với hầu hết mọi người nhận ra. Các thử nghiệm của chúng tôi — được chi tiết trong báo cáo độ chính xác phát hiện AI của chúng tôi — đã tìm thấy tỷ lệ dương tính giả từ 4% đến 12% tùy thuộc vào công cụ phát hiện.
Một số phong cách viết kích hoạt dương tính giả thường xuyên hơn:
Văn phong học thuật chính thức. Càng cấu trúc và chính xác hơn trong viết, văn bản của bạn càng giống với đầu ra của AI. Đó là vì các mô hình ngôn ngữ đã được đào tạo trên chính loại văn bản này. Nếu bạn viết các đoạn văn rõ ràng, được tổ chức tốt với thuật ngữ nhất quán, các công cụ phát hiện có thể đánh dấu bạn.
Viết tiếng Anh không phải là ngôn ngữ mẹ đẻ. Các nhà nghiên cứu viết bằng ngôn ngữ thứ hai hoặc thứ ba của họ thường sản xuất văn bản với sự đa dạng từ vựng thấp hơn và cấu trúc câu có tính công thức hơn. Các công cụ phát hiện giải thích điều này là do AI tạo ra.
Viết kỹ thuật và khoa học. Các phần phương pháp là đặc biệt vấn đề. "Các tham gia viên được tuyển chọn từ bệnh viện đại học giữa tháng 1 và tháng 3 năm 2025" là cách mà mọi phần phương pháp đều đọc — con người hay AI.
Văn bản đã được chỉnh sửa nhiều. Thật mỉa mai, càng chỉnh sửa tốt văn bản của bạn, nó càng có thể xuất hiện "giống AI" hơn với các công cụ phát hiện. Việc chỉnh sửa chuyên nghiệp làm mịn các bất thường mà báo hiệu tác giả là con người.
Điều này tạo ra một tình huống không thể cho các nhà nghiên cứu. Viết kém và bạn nghe có vẻ như con người. Viết tốt và bạn nghe như một cỗ máy.
Sự khác biệt giữa việc xoay vòng và nhân hóa thực sự
Không phải tất cả các phương pháp xử lý phát hiện AI đều như nhau. Chúng ta cần vạch ra một ranh giới rõ ràng ở đây.
Xoay vòng văn bản — thay thế từ bằng các từ đồng nghĩa ngẫu nhiên, sắp xếp lại câu một cách cơ học, thêm các cụm từ filler — là tương đương học thuật của việc đặt một bộ ria giả lên văn bản của bạn. Nó làm giảm chất lượng, giới thiệu lỗi và thường không hoạt động chống lại các công cụ phát hiện hiện đại.
Nhân hóa thực sự thì khác. Nó có nghĩa là cấu trúc lại văn bản để phản ánh các mẫu viết tự nhiên của con người — độ dài câu khác nhau, dấu hiệu giọng nói cá nhân, thay đổi đăng ký phù hợp với lĩnh vực, và loại sự không hoàn hảo có kiểm soát mà đặc trưng cho viết chính thống.
Sự phân biệt này cũng quan trọng về mặt đạo đức. Xoay vòng ý tưởng của người khác là đạo văn với các bước bổ sung. Nhân hóa bản nháp hỗ trợ AI của bạn — nơi mà nghiên cứu, phân tích và lập luận là của bạn — là chỉnh sửa.
Chúng tôi đã xây dựng công cụ nhân hóa văn bản của chúng tôi dựa trên nguyên tắc này. Nó cấu trúc lại các mẫu câu và tái giới thiệu sự biến thiên tự nhiên mà không làm giảm chất lượng học thuật hoặc thay thế các thuật ngữ kỹ thuật bằng các từ đồng nghĩa không chính xác.
Nhân hóa văn bản học thuật của bạn
Loại bỏ các cờ phát hiện AI trong khi vẫn bảo tồn giọng nói học thuật, trích dẫn và từ vựng kỹ thuật của bạn.
Thử công cụ Nhân hóa văn bản miễn phíSử dụng AI như một trợ lý viết so với việc nộp đầu ra của AI trực tiếp
Khung đạo đức ở đây không phức tạp. Nó liên quan đến sự đóng góp và tính minh bạch.
Sử dụng hợp pháp: Bạn thực hiện nghiên cứu, phân tích dữ liệu, hình thành lập luận và sử dụng AI để giúp soạn thảo hoặc chỉnh sửa văn bản thể hiện công việc gốc của bạn. Đóng góp trí tuệ là của bạn. AI đã giúp với văn phong — tương tự như cách một biên tập viên chuyên nghiệp hoặc một đồng nghiệp xem xét bản nháp của bạn sẽ giúp.
Sử dụng có vấn đề: Bạn đưa cho AI một chủ đề và nộp bất cứ điều gì nó tạo ra như là nghiên cứu của bạn. Không có dữ liệu gốc. Không có phân tích gốc. Không có tư tưởng gốc. AI đã thực hiện công việc trí tuệ, không phải bạn.
Hầu hết các nhà nghiên cứu đều nằm vững chắc trong danh mục đầu tiên. Họ đang sử dụng ChatGPT hoặc Claude để vượt qua bế tắc trong viết, cấu trúc các đoạn văn, hoặc dịch ý tưởng từ ngôn ngữ mẹ đẻ của họ sang tiếng Anh có thể xuất bản. Những ý tưởng đó là của họ. Cách diễn đạt đã được hỗ trợ.
Nếu điều đó mô tả bạn, việc nhân hóa bản nháp hỗ trợ AI của bạn không phải là gian lận — nó giống như bất kỳ bước chỉnh sửa nào khác. Để khám phá sâu hơn về câu hỏi này, hãy đọc bài viết của chúng tôi về việc sử dụng công cụ nhân hóa AI có phải là gian lận không.
Các chiến lược thực tiễn thực sự hiệu quả
Dựa trên kinh nghiệm của chúng tôi khi làm việc với các bản thảo học thuật, đây là những phương pháp mà liên tục giảm điểm phát hiện AI mà không làm giảm chất lượng.
Viết bản nháp đầu tiên bằng chính bạn — ngay cả khi nó thô. Sử dụng AI để tinh chỉnh, không phải để tạo ra. Một bản nháp thô do con người viết đã được AI chỉnh sửa đọc rất khác so với văn bản do AI tạo ra đã được chỉnh sửa nhẹ bởi một con người.
Sử dụng AI cho các nhiệm vụ cụ thể, không phải cho toàn bộ phần. Hãy yêu cầu nó cải thiện độ rõ ràng của một đoạn văn duy nhất. Hoặc đề xuất một chuyển tiếp tốt hơn giữa hai phần. Việc sử dụng có mục tiêu tạo ra văn bản hòa quyện tự nhiên với văn phong của bạn.
Tiêm các quan sát cá nhân. Các công cụ phát hiện gặp khó khăn với văn bản chứa quan điểm cá nhân chân thực. "Chúng tôi đã ngạc nhiên khi thấy rằng nhóm kiểm soát vượt trội hơn nhóm điều trị trên cả ba thước đo" báo hiệu tác giả là con người theo cách mà đầu ra thuần túy của AI gần như không bao giờ làm được.
Thay đổi cách tiếp cận chỉnh sửa của bạn. Đừng áp dụng cùng một lần chỉnh sửa cho mọi phần. Đọc phần phương pháp của bạn khác với phần thảo luận của bạn. Điều này tự nhiên tạo ra loại sự không nhất quán — theo cách tốt — mà đặc trưng cho các tài liệu do con người viết.
Chạy một lần nhân hóa trên các phần bị đánh dấu. Nếu bạn biết một phần cụ thể đọc quá "sạch", hãy cho nó qua công cụ nhân hóa văn bản của chúng tôi để tái giới thiệu sự biến thiên tự nhiên. Sau đó, xem lại đầu ra để đảm bảo nó vẫn nghe như bạn.
Để có hướng dẫn từng bước về quy trình này, hãy xem hướng dẫn của chúng tôi về cách nhân hóa văn bản AI.
Những gì cuộc trò chuyện về việc vượt qua phát hiện AI của Turnitin đã sai
Tìm kiếm "vượt qua phát hiện AI của Turnitin" và bạn sẽ tìm thấy hàng trăm bài viết về các mẹo — thêm ký tự vô hình, sử dụng các mẫu lệnh cụ thể, dịch qua nhiều ngôn ngữ. Hầu hết trong số này không còn hiệu quả nữa, và những cái còn lại tạo ra văn bản tồi tệ.
Giải pháp thực sự không phải là một mẹo. Đó là thực hành viết tốt kết hợp với các công cụ phù hợp.
Khi văn bản của bạn bị đánh dấu, câu trả lời không phải là để chơi trò chơi với công cụ phát hiện. Đó là để làm cho viết của bạn thực sự tốt hơn — đa dạng hơn, cá nhân hơn, phản ánh hơn về cách bạn thực sự nghĩ. Một công cụ nhân hóa tốt giúp bạn làm điều đó nhanh hơn. Nhưng mục tiêu không phải là để lừa ai cả. Mục tiêu là sản xuất văn bản chính xác đại diện cho đóng góp của bạn.
Đó không phải là vượt qua phát hiện. Đó là viết tốt.
Viết lại văn bản hỗ trợ AI để phù hợp với các mẫu viết tự nhiên của con người. Được xây dựng cho các nhà nghiên cứu.
Các câu hỏi thường gặp
Q: Turnitin có thể phát hiện văn bản AI đã được nhân hóa không?
Điều này phụ thuộc vào chất lượng nhân hóa. Việc thay thế từ đồng nghĩa cơ bản và sắp xếp lại câu thường vẫn bị đánh dấu — mô hình phát hiện AI của Turnitin đã được đào tạo để bắt những mẫu này. Tuy nhiên, việc nhân hóa kỹ lưỡng thực sự cấu trúc lại các mẫu văn bản, thay đổi nhịp điệu câu và giới thiệu các dấu hiệu giọng nói chân thực thường xuyên giảm điểm phát hiện xuống dưới ngưỡng đánh dấu của Turnitin. Chúng tôi đã thử nghiệm điều này trên hàng trăm bản thảo, và văn bản đã được nhân hóa tốt thường có điểm dưới 15% trên chỉ số AI của Turnitin.
Q: Tỷ lệ dương tính giả của các công cụ phát hiện AI là bao nhiêu?
Trong các thử nghiệm của chúng tôi, tỷ lệ dương tính giả dao động từ 4% đến 12% trên các công cụ phát hiện chính. GPTZero có tỷ lệ dương tính giả cao nhất trên văn bản học thuật, trong khi Turnitin hoạt động tốt nhất trên các bài nộp của sinh viên. Các nhà văn không phải là người bản ngữ và tác giả của nội dung kỹ thuật cao nhất trải qua tỷ lệ dương tính giả cao nhất. Để có số liệu chi tiết, hãy xem kết quả thử nghiệm độ chính xác phát hiện AI của chúng tôi.
Q: Vượt qua phát hiện AI có được coi là gian lận không?
Điều này hoàn toàn phụ thuộc vào ngữ cảnh. Nếu bạn đang nộp nội dung do AI tạo ra như là công việc gốc của bạn mà không có đóng góp trí tuệ, đó là sự không trung thực học thuật bất kể việc phát hiện có bắt được hay không. Nếu bạn đang sử dụng AI như một công cụ viết và nhân hóa đầu ra để phản ánh tốt hơn giọng nói và ý tưởng chân thực của bạn, đó là chỉnh sửa — không phải gian lận. Hầu hết các chính sách AI của các trường đại học phân biệt giữa việc sử dụng AI như một trợ lý và nộp đầu ra của AI như công việc gốc. Kiểm tra chính sách cụ thể của tổ chức bạn và tiết lộ việc sử dụng công cụ AI nơi mà hướng dẫn của bạn yêu cầu.
Q: Tôi có cần phải tiết lộ nếu tôi đã sử dụng sự hỗ trợ của AI không?
Ngày càng nhiều, có. Các nhà xuất bản lớn bao gồm Springer Nature, Elsevier và PNAS hiện yêu cầu tiết lộ việc sử dụng công cụ AI trong việc chuẩn bị bản thảo. Hầu hết các chính sách của trường đại học cũng đang đi theo hướng tương tự. Khuyến nghị của chúng tôi: luôn tiết lộ. Một tuyên bố ngắn như "Các công cụ viết AI đã được sử dụng để chỉnh sửa ngôn ngữ; tất cả nghiên cứu, phân tích và nội dung trí tuệ đều là của tác giả" sẽ bảo vệ bạn một cách trung thực và minh bạch. Việc tiết lộ bảo vệ bạn nhiều hơn so với việc che giấu.

Ema is a senior academic editor at ProofreaderPro.ai with a PhD in Computational Linguistics. She specializes in text analysis technology and language models, and is passionate about making AI-powered tools that truly understand academic writing. When she's not refining proofreading algorithms, she's reviewing papers on NLP and discourse analysis.