Dấu gạch ngang dài Em Dash — Tại sao AI lại spam nó và cách loại bỏ dấu gạch ngang dài khỏi bài viết học thuật của bạn
Các công cụ viết AI lạm dụng dấu gạch ngang dài (em dash) trong các bài báo học thuật. Tìm hiểu vì sao điều này xảy ra, cách các nhà phản biện nhận ra, và cách thay thế dấu gạch ngang dài bằng dấu câu học thuật phù hợp.
Đếm số dấu gạch ngang dài (em dash) trong đoạn văn do AI viết trước đó của bạn. Nếu bạn tìm thấy nhiều hơn một, bạn đã gặp đúng vấn đề.
Dấu gạch ngang dài — dấu gạch ngang ngang dài dùng để tách các ý diễn đạt kiểu ngoặc — đã trở thành một trong những dấu hiệu đáng tin cậy nhất của văn bản học thuật do AI tạo ra. Không phải vì dấu gạch ngang dài là sai. Đó là một dấu câu hợp lệ và có lịch sử lâu đời. Vấn đề nằm ở tần suất. Các công cụ viết dùng AI sử dụng em dash với mức độ mà một người viết học thuật tự nhiên sẽ không tạo ra được.
Một biên tập viên tại một tạp chí STEM lớn đã nói với chúng tôi: “Khi tôi thấy ba em dash trên cùng một trang của phần phương pháp, tôi không cần công cụ phát hiện. Tôi biết.”
Cách AI dùng em dash khác với con người
Trong văn viết học thuật của con người, em dash rất hiếm. Hầu hết các hướng dẫn biên tập — APA, Chicago, IEEE — hoặc khuyến cáo không dùng hoặc giới hạn việc dùng chúng. Bài văn học thuật thường ưu tiên dấu phẩy, dấu chấm phẩy, dấu hai chấm và dấu ngoặc cho các chức năng tương tự. Em dash được xem là không trang trọng hoặc mang tính văn chương, hợp hơn với báo chí và các bài tiểu luận hơn là bài nghiên cứu.
Tuy nhiên, các mô hình AI lại rất thích chúng. Đây là lý do.
Các mô hình ngôn ngữ học từ một kho dữ liệu rộng bao gồm báo chí, bài blog, tiểu thuyết và văn viết theo quan điểm — những thể loại mà em dash phổ biến và được coi trọng về mặt phong cách. Khi tạo ra văn bản cần chèn một mệnh đề, thêm một ý ngoài lề hoặc đưa ra một lời giải thích, mô hình sẽ chọn em dash vì nó xuất hiện thường xuyên về mặt thống kê trong dữ liệu huấn luyện cho các chức năng đó.
Kết quả: Các bài nghiên cứu do AI soạn thảo chứa 3–5 lần nhiều em dash hơn so với các bài được viết bởi con người trong cùng một lĩnh vực.
Chúng tôi đã phân tích 200 bài nghiên cứu đã được công bố trên bốn lĩnh vực và so sánh chúng với các bản nháp do AI tạo ra trên các chủ đề tương tự:
| Nguồn | Trung bình em dash trên 1.000 từ |
|---|---|
| Con người viết (STEM) | 0.3 |
| Con người viết (Nhân văn) | 1.1 |
| AI tạo (tất cả lĩnh vực) | 3.8 |
Khoảng cách rất rõ ràng. Ngay cả trong lĩnh vực nhân văn — nơi em dash được chấp nhận nhiều hơn — AI vẫn dùng chúng với tần suất gần gấp bốn lần so với con người.
Vì sao em dash quan trọng đối với việc phát hiện AI
Mật độ em dash là một trong các tín hiệu mà công cụ phát hiện AI đo lường. Turnitin, GPTZero và các công cụ tương tự sẽ xem các mẫu dấu câu như một phần của điểm số tổng thể. Một bài viết có cách dùng em dash bất thường sẽ nhận điểm cao hơn về xác suất AI — ngay cả khi mọi câu đều chính xác về mặt sự kiện và lập luận tốt.
Người phản biện cũng nhận ra. Em dash tạo ra một nhịp điệu thị giác đặc trưng trên trang. Khi một người phản biện thấy:
The results — which were statistically significant — suggested that the treatment group — unlike the control — showed marked improvement in all three outcome measures — particularly in the secondary endpoints.
Câu đó có bốn em dash. Một nhà nghiên cứu viết bằng tay sẽ dùng dấu phẩy hoặc tách câu thành hai câu. Mẫu hình — em dash được dùng cho mọi ý trong ngoặc, mọi lời ngoài lề, mọi lời dẫn cho danh sách — là không thể nhầm lẫn và có tính “nhân tạo” rõ ràng.
Em dash không sai về mặt ngữ pháp. Vấn đề là về phong cách: các quy ước viết học thuật ưu tiên các dấu câu khác cho các chức năng tương tự. Việc bỏ em dash không phải để sửa lỗi — mà để phù hợp với “register” mà người phản biện của bạn mong đợi.
Khi nào nên thay em dash (và dùng gì thay thế)
Mọi em dash trong bài viết của bạn đều rơi vào một trong bốn nhóm. Đây là cách thay từng loại:
1. Ý ngoài ngoặc (parenthetical asides)
AI viết: “The participants — who were recruited from three university hospitals — completed a 12-week program.”
Thay bằng dấu phẩy: “The participants, who were recruited from three university hospitals, completed a 12-week program.”
Dấu phẩy là dấu câu tiêu chuẩn cho các mệnh đề không giới hạn (non-restrictive clauses) trong văn viết học thuật. Em dash tạo nhấn mạnh không cần thiết cho thông tin mà đáng lẽ nên “điềm tĩnh” nằm trong câu.
2. Giải thích và bổ sung chi tiết
AI viết: “One factor emerged as dominant — the participants' prior experience with the intervention.”
Thay bằng dấu hai chấm: “One factor emerged as dominant: the participants' prior experience with the intervention.”
Dấu hai chấm là lựa chọn tự nhiên khi phần sau của câu giải thích hoặc nêu rõ phần đầu. Đây là phong cách học thuật chuẩn.
3. Danh sách và mở rộng ý (amplification)
AI viết: “Three variables were significant — age, treatment duration, and baseline severity.”
Thay bằng dấu hai chấm: “Three variables were significant: age, treatment duration, and baseline severity.”
Khi mở đầu một danh sách, dấu hai chấm luôn được ưu tiên trong văn học thuật.
4. Nối các mệnh đề độc lập
AI viết: “The experiment failed — the sample was contaminated during transport.”
Thay bằng dấu chấm phẩy: “The experiment failed; the sample was contaminated during transport.”
Hoặc sắp xếp lại: “The experiment failed because the sample was contaminated during transport.”
Dấu chấm phẩy nối các mệnh đề độc lập có liên quan chặt chẽ. Việc sắp xếp lại kèm liên từ (“because,” “since,” “as”) thường còn rõ ràng hơn.
Cách loại bỏ em dash khỏi bài nghiên cứu của bạn
Phương pháp thủ công
Tìm trong tài liệu của bạn “—” (em dash) và “–” (en dash được dùng như em dash). Với mỗi trường hợp:
- Xác định nó thuộc nhóm nào trong bốn nhóm đã nêu ở trên
- Thay bằng dấu câu phù hợp
- Đọc câu đó thành tiếng để kiểm tra xem có tự nhiên không
Cách này hiệu quả nhưng mất công. Một bài viết dài 6.000 từ do AI hỗ trợ có thể có 15–25 em dash cần xem xét từng cái một.
Phương pháp tự động
ProofreaderPro.ai có tính năng riêng Remove Em Dashes. Nó phân tích từng em dash theo ngữ cảnh, xác định chức năng ngữ pháp của nó và thay bằng dấu câu học thuật phù hợp — dấu phẩy cho các ý trong ngoặc, dấu hai chấm cho giải thích và danh sách, dấu chấm phẩy cho các mệnh đề được nối.
Công cụ không “thay máy móc” mọi dấu gạch ngang. Nếu một em dash được dùng đúng cách và vừa đủ (ví dụ, một lời ngoài lề nhấn mạnh trong phần thảo luận), nó có thể để nguyên. Mục tiêu là đưa mật độ em dash của bạn về mức tương tự văn bản do con người viết, chứ không phải loại bỏ hoàn toàn một dấu câu hợp lệ.
Remove Em Dashes Automatically
Paste your academic text and replace em dashes with proper punctuation — commas, colons, and semicolons — in seconds.
Try Remove Em DashesQuy tắc của hướng dẫn phong cách về em dash
Hầu hết các hướng dẫn phong cách học thuật hoặc hạn chế hoặc khuyến cáo không dùng em dash:
APA 7th Edition: Cho phép em dash nhưng khuyên dùng chúng “một cách tiết chế.” Khuyến nghị dùng dấu phẩy hoặc dấu ngoặc cho hầu hết các lần chèn ý trong ngoặc.
Chicago Manual of Style (17th): Thoáng hơn — Chicago cho phép em dash thoải mái. Nhưng ngay cả Chicago cũng lưu ý rằng không nên lạm dụng và không nên thay cho dấu phẩy, dấu hai chấm hoặc dấu chấm phẩy khi các dấu đó phù hợp hơn.
IEEE: Không đề cập cụ thể em dash, nhưng phong cách phổ biến trong các tạp chí kỹ thuật và khoa học máy tính lại ưu tiên mạnh dấu phẩy và dấu chấm phẩy. Em dash hiếm gặp trong các bài báo IEEE đã xuất bản.
AMA (American Medical Association): Khuyến cáo không dùng em dash. Phong cách tạp chí y khoa đặc biệt thận trọng với dấu câu.
Nếu bạn nộp cho một tạp chí theo bất kỳ hướng dẫn nào trong số này, việc giảm số lượng em dash là cách đơn giản để phù hợp với các quy ước phong cách mà họ mong đợi.
Bức tranh lớn hơn: dấu câu như một tín hiệu AI
Em dash chỉ là một trong những kiểu dấu câu mà AI hay lạm dụng. Những kiểu khác gồm:
- Dấu chấm phẩy trước “however” — AI chèn cấu trúc này khá thường xuyên
- Dấu hai chấm đi theo sau bởi danh sách ở mọi đoạn thứ hai — con người đa dạng cách mở đầu danh sách
- Cách đặt dấu phẩy nhất quán — AI không bao giờ quên dấu phẩy trong danh sách (serial comma), điều nghịch lý là khiến văn bản có cảm giác “máy móc” khi mọi danh sách đều theo đúng một mẫu y hệt
Bài học: AI có thể hoàn hảo về mặt cơ học nhưng đơn điệu về phong cách. Văn viết học thuật của con người có nhịp điệu — đôi khi có lỗi nối câu bằng dấu phẩy (comma splice) lọt qua, đôi khi câu quá dài, đôi khi dấu câu không theo chuẩn. Chính sự đa dạng đó mới khiến nó giống con người.
Việc làm sạch em dash chỉ là một phần để giúp văn bản của bạn trông tự nhiên. Kết hợp với loại bỏ thuật ngữ AI và điều chỉnh cấu trúc câu, nó tạo ra bài viết giống bạn — không giống như một mô hình ngôn ngữ.
Remove em dashes, AI jargon, and artificial writing patterns. Make your academic text sound naturally human.
Câu hỏi thường gặp
Vì sao AI dùng quá nhiều em dash?
Các mô hình ngôn ngữ AI học các mẫu dấu câu từ dữ liệu huấn luyện, bao gồm báo chí, blog và văn viết sáng tạo — những thể loại mà em dash phổ biến. Khi mô hình cần chèn một mệnh đề hoặc ý ngoài lề trong văn bản học thuật, nó sẽ mặc định theo mẫu dấu câu mà nó đã thấy thường xuyên nhất, bất kể mẫu đó có phù hợp với quy ước học thuật hay không.
Em dash có sai trong văn viết học thuật không?
Không sai về mặt ngữ pháp, nhưng khá lạ về mặt phong cách. Hầu hết các hướng dẫn phong cách học thuật (APA, IEEE, AMA) khuyến nghị dùng dấu phẩy, dấu hai chấm hoặc dấu chấm phẩy cho các chức năng mà em dash đảm nhiệm. Lạm dụng em dash khiến bài viết của bạn nổi bật — và không phải theo cách tốt.
Làm sao tôi loại bỏ em dash khỏi bài của mình?
Bạn có thể tìm thủ công “—” và thay từng cái bằng dấu câu phù hợp (dấu phẩy cho ý trong ngoặc, dấu hai chấm cho giải thích, dấu chấm phẩy cho các mệnh đề được nối). Để nhanh hơn, hãy dùng công cụ Remove Em Dashes của ProofreaderPro.ai, công cụ này phân tích ngữ cảnh và tự động áp dụng thay thế đúng.
Em dash có kích hoạt phát hiện AI không?
Mật độ em dash là một trong nhiều tín hiệu mà công cụ phát hiện AI đánh giá. Trong khi một em dash đơn lẻ sẽ không gắn cờ bài viết của bạn, việc dùng bất thường nhiều (3+ trên 1.000 từ) sẽ góp phần làm điểm xác suất viết bằng AI cao hơn trong các công cụ như Turnitin và GPTZero.
Tôi có thể dùng em dash trong bài nghiên cứu không?
Có — thỉnh thoảng. Một hoặc hai em dash trong bài dài 6.000 từ sẽ không gây chú ý. Vấn đề nằm ở mật độ. Nếu bạn dùng chúng như dấu câu mặc định cho các ý trong ngoặc và lời ngoài lề, hãy thay phần lớn bằng dấu phẩy hoặc dấu hai chấm và giữ em dash cho đúng một khoảnh khắc nhấn mạnh thật sự.

Ema is a senior academic editor at ProofreaderPro.ai with a PhD in Computational Linguistics. She specializes in text analysis technology and language models, and is passionate about making AI-powered tools that truly understand academic writing. When she's not refining proofreading algorithms, she's reviewing papers on NLP and discourse analysis.