Tại sao hầu hết các công cụ diễn đạt lại phá hủy trích dẫn của bạn (và cách khắc phục điều đó)
Các công cụ diễn đạt chung phá vỡ các trích dẫn APA, MLA và IEEE. Đây là lý do tại sao điều này xảy ra và cách các công cụ diễn đạt AI nhận thức được trích dẫn giải quyết vấn đề.
Chúng tôi đã chạy một đoạn văn qua năm công cụ diễn đạt phổ biến. Đoạn văn chứa hai trích dẫn trong văn bản theo định dạng APA, một trích dẫn trực tiếp với số trang và một tham chiếu đến một hình cụ thể trong một tác phẩm đã được trích dẫn. Mỗi công cụ đều phá vỡ ít nhất một trích dẫn. Ba trong số đó đã phá vỡ cả bốn trích dẫn.
Điều này không phải là một trường hợp ngoại lệ. Đó là điều bình thường.
Nếu bạn viết văn bản học thuật — loại có "(Smith et al., 2024, p. 47)" và "[12]-[15]" rải rác khắp nơi — hầu hết các công cụ diễn đạt sẽ gây hại cho công việc của bạn. Đây là lý do tại sao điều này xảy ra và bạn nên làm gì về điều đó.
Cách các công cụ diễn đạt chung làm hỏng trích dẫn
Các công cụ diễn đạt chung coi mọi thứ như văn bản cần được viết lại. Chúng không hiểu rằng "(Johnson & Lee, 2023)" là một trích dẫn cần phải được giữ nguyên. Đối với thuật toán, đó chỉ là từ ngữ và dấu câu — là mục tiêu hợp pháp để sửa đổi.
Chúng tôi đã lập danh sách các cách cụ thể mà trích dẫn bị hỏng trong quá trình diễn đạt. Các mẫu là có thể dự đoán được.
Định dạng lại tên. "Smith et al. (2024)" trở thành "Smith và những người khác (2024)" hoặc "Smith và các đồng nghiệp (2024)." Công cụ nhìn thấy "et al." như một cụm từ có thể diễn đạt lại. Trong định dạng APA, sự thay đổi này vi phạm hướng dẫn phong cách và tạo ra một trích dẫn không khớp với danh sách tham khảo của bạn.
Di chuyển trích dẫn. Các trích dẫn giữa câu bị di chuyển đến vị trí cuối câu. Nghe có vẻ nhỏ nhặt. Nhưng không phải vậy. Trong viết học thuật, vị trí của trích dẫn cho biết chính xác tuyên bố nào được hỗ trợ bởi nguồn nào. Việc di chuyển "(Park, 2022)" từ sau một mệnh đề cụ thể đến cuối câu hoàn toàn thay đổi phạm vi thuộc tính.
Hỏng số. Các trích dẫn số theo kiểu IEEE như "[3]" hoặc "[7]-[10]" bị coi là nội dung. Chúng tôi đã thấy "[3]" trở thành "[ba]," "[7]-[10]" trở thành "[7] đến [10]," và trong một trường hợp đáng nhớ, "[12]" đơn giản biến mất vì công cụ đã hiểu nó như một hiện vật.
Xóa số trang. Các trích dẫn trực tiếp yêu cầu số trang — "(Williams, 2023, p. 142)." Các công cụ diễn đạt thường xuyên xóa tham chiếu số trang, để lại "(Williams, 2023)." Vì công cụ cũng diễn đạt lại chính trích dẫn trực tiếp — biến nó thành một cách diễn đạt lại — bạn mất cả từ ngữ chính xác và thuộc tính số trang cần thiết.
Thay đổi tên tác giả. Nghe có vẻ không thể, nhưng chúng tôi đã ghi lại điều này. Một công cụ đã diễn đạt lại "Theo Greenfield (2021)" thành "Theo Greenfield (2021)" trong hầu hết các trường hợp — nhưng đôi khi đã thay đổi "Greenfield" thành một từ đồng nghĩa gần gũi. Tên không bao giờ nên là văn bản có thể sửa đổi.
Thay đổi năm. Hiếm nhưng thảm khốc. Chúng tôi đã tìm thấy một trường hợp mà một công cụ đã thay đổi "(2023)" thành "(hai mươi hai mươi ba)" trong một chuyển đổi số thành văn bản rõ ràng. Một công cụ khác đã thay đổi "(2024a)" thành "(2024)" — bỏ qua chữ cái phân biệt giữa hai ấn phẩm của cùng một tác giả trong cùng một năm.
Thách thức kỹ thuật của việc viết lại nhận thức về trích dẫn
Tại sao các công cụ chung không thể "bỏ qua" các trích dẫn? Bởi vì việc xác định các trích dẫn khó hơn nó trông có vẻ.
Các trích dẫn APA theo các mẫu như "(Tác giả, Năm)" — nhưng cũng có nhiều phụ đề không phải trích dẫn. "Cuộc khảo sát (được thực hiện vào năm 2023) cho thấy..." không phải là một trích dẫn, nhưng nó khớp với mẫu. MLA sử dụng định dạng tác giả-số trang: "(Smith 142)." IEEE sử dụng số trong dấu ngoặc: "[3]." Chicago sử dụng chú thích. Vancouver sử dụng số mũ.
Một công cụ nhận thức về trích dẫn cần phải:
- Phát hiện định dạng trích dẫn đang được sử dụng trong tài liệu — APA, MLA, Chicago, IEEE, Vancouver, hoặc hỗn hợp
- Xác định từng trường hợp trích dẫn trong văn bản, phân biệt các trích dẫn với các yếu tố không phải trích dẫn có hình thức tương tự
- Lập bản đồ phạm vi trích dẫn — hiểu đoạn văn nào mà mỗi trích dẫn hỗ trợ
- Bảo tồn vị trí trích dẫn tương đối với các tuyên bố mà chúng hỗ trợ, ngay cả khi văn bản xung quanh được cấu trúc lại
- Duy trì định dạng trích dẫn chính xác — bao gồm các quy ước "et al.", chữ cái năm, số trang và các khoảng trong dấu ngoặc
Điều này đòi hỏi xử lý NLP chuyên biệt mà các công cụ diễn đạt chung không có. Không phải là họ không chọn xây dựng nó. Mà là kiến trúc của họ không được thiết kế cho điều đó.
Xây dựng nhận thức về trích dẫn vào công cụ diễn đạt học thuật của chúng tôi yêu cầu đào tạo trên hàng trăm nghìn đoạn văn học thuật được trích dẫn đúng cách trong tất cả các phong cách trích dẫn chính. Mô hình đã học không chỉ những gì trích dẫn trông như thế nào, mà còn cách chúng hoạt động trong câu — điều này cho phép nó bảo tồn cả hình thức và ý nghĩa trong quá trình diễn đạt lại.
Kiểm tra bảo tồn trích dẫn: QuillBot so với ProofreaderPro.ai
Chúng tôi đã thiết kế một bài kiểm tra nghiêm ngặt. Năm mươi đoạn văn học thuật, mỗi đoạn chứa 2-4 trích dẫn trong văn bản. Mười đoạn văn mỗi đoạn theo định dạng APA, MLA, Chicago tác giả-ngày, IEEE và Vancouver. Chúng tôi đã chạy từng đoạn qua cả hai công cụ và đánh giá đầu ra.
Định dạng APA (10 đoạn): ProofreaderPro.ai đã bảo tồn tất cả các trích dẫn đúng cách trong 10/10 đoạn. QuillBot đã bảo tồn các trích dẫn đúng cách trong 3/10 — lỗi phổ biến nhất là định dạng lại "et al." và di chuyển vị trí trích dẫn.
Định dạng MLA (10 đoạn): ProofreaderPro.ai: 10/10 đúng. QuillBot: 4/10 — số trang thường xuyên bị xóa, và tên tác giả đôi khi bị sửa đổi.
Chicago tác giả-ngày (10 đoạn): ProofreaderPro.ai: 10/10 đúng. QuillBot: 5/10 — tốt hơn so với APA/MLA vì Chicago tác giả-ngày ít giống văn bản tự nhiên hơn, nhưng vẫn không nhất quán.
Định dạng IEEE (10 đoạn): ProofreaderPro.ai: 9/10 đúng (một trường hợp ngoại lệ với một khoảng trong dấu ngoặc phức tạp đã được sửa chữa). QuillBot: 2/10 — các trích dẫn số đặc biệt dễ bị hỏng.
Định dạng Vancouver (10 đoạn): ProofreaderPro.ai: 10/10 đúng. QuillBot: 3/10 — các số mũ thường xuyên bị chuyển đổi thành văn bản trong dòng.
Tổng hợp: ProofreaderPro.ai đã bảo tồn các trích dẫn chính xác trong 98% các đoạn. QuillBot đã bảo tồn chúng trong 34%.
Để so sánh rộng hơn về các công cụ này, xem phân tích chi tiết của chúng tôi về QuillBot thay thế cho viết học thuật.
Diễn đạt mà không phá hủy trích dẫn
Công cụ diễn đạt nhận thức về trích dẫn của chúng tôi nhận diện các định dạng APA, MLA, Chicago, IEEE và Vancouver. Các tham chiếu của bạn vẫn được giữ nguyên. Hãy thử miễn phí.
Get Started FreeQuy trình làm việc cho việc diễn đạt văn bản có nhiều trích dẫn
Ngay cả với một công cụ nhận thức về trích dẫn, chúng tôi khuyên bạn nên có một quy trình làm việc cẩn thận cho văn bản dày đặc với các tham chiếu.
Bước 1: Xác định mật độ trích dẫn. Nếu một đoạn có nhiều trích dẫn hơn số câu, hãy xem xét liệu việc diễn đạt có phải là cách tiếp cận đúng hay không. Đôi khi một trích dẫn trực tiếp với thuộc tính đúng đắn sẽ rõ ràng hơn.
Bước 2: Diễn đạt theo từng phần kích thước. Đừng dán toàn bộ bản thảo 30 trang của bạn cùng một lúc. Làm việc từng phần một — giới thiệu, phương pháp, kết quả, thảo luận. Điều này giúp bạn kiểm soát tốt hơn và dễ dàng hơn trong việc xem xét.
Bước 3: Xác minh từng trích dẫn sau khi diễn đạt. Mở đầu ra của bạn và kiểm tra một cách hệ thống từng trích dẫn so với bản gốc. Xác nhận rằng tên tác giả, năm, số trang và vị trí đều đúng. Điều này mất năm phút cho mỗi phần và ngăn ngừa các lỗi có thể mất hàng giờ để theo dõi sau này.
Bước 4: Đối chiếu với thư mục của bạn. Sau khi diễn đạt, hãy đảm bảo rằng mỗi trích dẫn trong văn bản vẫn khớp với một mục trong danh sách tham khảo của bạn. Các công cụ diễn đạt mà sửa đổi định dạng trích dẫn có thể tạo ra sự không khớp — "(Smith, et al., 2024)" sẽ không khớp với một mục danh sách tham khảo được định dạng là "Smith et al. (2024)" trong một số trình quản lý tham khảo.
Bước 5: Chạy một lượt kiểm tra cuối cùng. Sau khi diễn đạt và xác minh trích dẫn, hãy đọc lại toàn bộ văn bản. Việc diễn đạt có thể đôi khi gây ra các vấn đề ngữ pháp ở các ranh giới giữa văn bản đã diễn đạt lại và văn bản không được diễn đạt lại.
Chi phí thực sự của việc trích dẫn bị hỏng
Các trích dẫn bị hỏng không chỉ gây khó chịu. Chúng mang lại những hậu quả thực sự.
Một trích dẫn bị thiếu hoặc không chính xác có thể cấu thành đạo văn — ngay cả đạo văn không cố ý. Nếu một công cụ diễn đạt xóa một trích dẫn trong quá trình viết lại, văn bản kết quả trình bày phát hiện của người khác mà không có thuộc tính. Bạn có thể không nhận ra cho đến khi một người đánh giá hoặc công cụ kiểm tra đạo văn đánh dấu nó.
Các trích dẫn được định dạng lại tạo ra sự không khớp trong danh sách tham khảo. Nếu trích dẫn trong văn bản của bạn nói "(Smith và những người khác, 2024)" nhưng danh sách tham khảo của bạn nói "Smith et al. (2024)," trình quản lý tham khảo của bạn sẽ không liên kết chúng. Một số tạp chí từ chối các bản thảo có trích dẫn không liên kết.
Các trích dẫn bị di chuyển làm sai lệch các tuyên bố. Đây là vấn đề tinh vi và nguy hiểm nhất. Khi một công cụ di chuyển một trích dẫn từ giữa câu đến cuối câu, nó có vẻ đúng khi đọc qua. Nhưng thuộc tính đã thay đổi — và một người đánh giá cẩn thận sẽ nhận thấy rằng trích dẫn không hỗ trợ tuyên bố rộng hơn mà nó hiện đang có vẻ tham chiếu.
Chúng tôi ước tính rằng việc sửa chữa các lỗi trích dẫn do các công cụ diễn đạt chung gây ra tốn thêm 30-60 phút cho mỗi bài viết. Trong suốt sự nghiệp xuất bản, đó là thời gian đáng kể dành cho việc sửa chữa các vấn đề không nên tồn tại.
Diễn đạt văn bản học thuật trong khi bảo tồn các trích dẫn APA, MLA, Chicago, IEEE và Vancouver một cách hoàn hảo.
Đọc thêm
- Tránh đạo văn tự thân với AI
- Diễn đạt so với đạo văn: Nơi vẽ đường ranh giới
- ProofreaderPro.ai so với QuillBot cho các nhà nghiên cứu
Câu hỏi thường gặp
Q: Tại sao các công cụ diễn đạt lại phá hủy trích dẫn của tôi?
Các công cụ diễn đạt chung coi tất cả văn bản là nội dung cần được viết lại. Chúng không có logic chuyên biệt để xác định, phân loại và bảo vệ các trích dẫn. Đối với những công cụ này, "(Smith et al., 2024)" chỉ là một chuỗi từ và dấu câu — vì vậy chúng sửa đổi nó theo cách mà chúng sẽ sửa đổi bất kỳ cụm từ nào khác. Việc xây dựng nhận thức về trích dẫn yêu cầu đào tạo chuyên biệt về các định dạng văn bản học thuật, mà hầu hết các công cụ đa năng chưa thực hiện.
Q: Công cụ diễn đạt AI nào bảo tồn các trích dẫn APA?
Công cụ diễn đạt học thuật của ProofreaderPro.ai được thiết kế đặc biệt để phát hiện và bảo tồn các trích dẫn APA trong quá trình diễn đạt — cùng với các định dạng MLA, Chicago, IEEE và Vancouver. Trong các bài kiểm tra của chúng tôi, nó đã bảo tồn các trích dẫn đúng cách trong 98% các đoạn văn trong cả năm định dạng. Công cụ xác định các yếu tố trích dẫn như nội dung được bảo vệ và cấu trúc lại văn bản xung quanh mà không sửa đổi định dạng hoặc vị trí của các trích dẫn.
Q: Tôi có thể diễn đạt văn bản chứa các trích dẫn trong văn bản không?
Có, nhưng bạn cần một công cụ xử lý các trích dẫn đúng cách. Khi diễn đạt văn bản có trích dẫn, ngôn ngữ nên thay đổi trong khi các trích dẫn vẫn giữ nguyên như trước — định dạng đúng, vị trí đúng tương đối với các tuyên bố mà chúng hỗ trợ, tên tác giả và năm đúng. Nếu công cụ hiện tại của bạn sửa đổi các trích dẫn trong quá trình diễn đạt, hãy chuyển sang một công cụ nhận thức về trích dẫn hoặc xác minh và sửa chữa từng trích dẫn sau mỗi lần diễn đạt lại.

Ema is a senior academic editor at ProofreaderPro.ai with a PhD in Computational Linguistics. She specializes in text analysis technology and language models, and is passionate about making AI-powered tools that truly understand academic writing. When she's not refining proofreading algorithms, she's reviewing papers on NLP and discourse analysis.