Burstiness در نوشتن هوش مصنوعی چیست؟ معیاری که تعیین میکند انسان به نظر میرسد
Burstiness تنوع جملات را اندازه گیری می کند - و این گونه است که آشکارسازهای هوش مصنوعی به انسان ها از ماشین ها می گویند. در اینجا معنای آن برای نوشتن دانشگاهی شما آمده است.
هر پاراگراف نوشته شده توسط یک انسان را بخوانید. واقعا بهش نگاه کن بعضی جملات پنج کلمه هستند. برخی دیگر در طول چهل امتداد دارند و پیش از اینکه سرانجام به جایی برسند، زیرشاخهها و صلاحیتها را طی میکنند. این تنوع - آن ریتم غیرقابل پیش بینی - همان چیزی است که ابزارهای تشخیص هوش مصنوعی آن را انفجار می نامند.
و پیش نویس تولید شده توسط هوش مصنوعی شما تقریباً به اندازه کافی آن را ندارد.
ما 200 نمونه متن دانشگاهی را در مقولههای نوشته شده توسط انسان و تولید شده توسط هوش مصنوعی تجزیه و تحلیل کردیم. تفاوت در انفجار تنها واضح ترین سیگنال بود که دو گروه را از هم جدا می کرد - قابل اعتمادتر از تجزیه و تحلیل واژگان، سازگارتر از گیجی به تنهایی.
Burstiness تعریف شده: ریتم جملات شما
Burstiness اندازهگیری میکند که طول و پیچیدگی جمله در متن چقدر متفاوت است. ترکیدگی زیاد به معنای تنوع چشمگیر است - جملات کوتاه تند مخلوط با جملات پیچیده طولانی. ترکیدگی کم به معنای یکنواختی است - جمله به جمله در همان محدوده 15 تا 20 کلمه فرود می آیند.
این مفهوم از نظریه اطلاعات ناشی می شود. به زبان طبیعی، ارتباطات انسانی "ترکیده" است - ما ایده ها را در قسمت های نامنظم دسته بندی می کنیم. ما یک جمله فشرده و پیچیده مملو از اطلاعات می نویسیم. سپس متوقف می شویم. یکی کوتاه. سپس دوباره به ساخت و ساز طولانی دیگری می رویم.
هوش مصنوعی این کار را به طور طبیعی انجام نمی دهد. مدلهای زبان متن را با پیشبینی محتملترین نشانه بعدی تولید میکنند، و این فرآیند تمایل به تولید خروجی کاملاً یکنواخت دارد. طول جملات به شدت در اطراف میانگین جمع می شوند. ساختار پاراگراف تکرار می شود. متن به آرامی جریان می یابد - خیلی هموار.
ما این را مستقیماً اندازه گیری کردیم. در مجموعه دادههای 200 نمونهای ما، متن آکادمیک نوشته شده توسط انسان انحراف معیار طول جمله 8.2 کلمه را نشان داد. متن تولید شده توسط هوش مصنوعی از GPT-4o به طور متوسط 4.1 کلمه است. کلود در 5.3 کلمه کمی بهتر بود. اما هیچ کدام به تغییرپذیری نوشتار انسانی نزدیک نشدند.
این شکاف همان چیزی است که آشکارسازها از آن بهره برداری می کنند.
چرا متن هوش مصنوعی ترکیدگی کم دارد
درک اینکه چرا هوش مصنوعی با انفجار کم می نویسد به شما کمک می کند تا بفهمید که چرا متریک کار می کند - و کجا شکست می خورد.
مدل های زبان برای پیش بینی متن احتمالی آموزش داده می شوند. هنگام تولید یک جمله، مدل نشانه هایی را انتخاب می کند که با الگوهای آماری داده های آموزشی خود مطابقت داشته باشد. نتیجه متنی است که به سمت ساختهای میانی جملات میرود: نه خیلی کوتاه (که ناگهانی به نظر میرسد)، نه خیلی طولانی (که باعث انسجام میشود)، اما به طور مداوم در یک محدوده متوسط راحت.
نویسندگان انسانی متفاوت عمل می کنند. ما بر اساس تاکید، ریتم و خواسته های خاص هر ایده می نویسیم. یک یافته انتقادی جمله کوتاه خود را برای تأثیر میگیرد. یک روش پیچیده نیاز به ساخت طولانی تری دارد تا تمام قطعات متحرک را به تصویر بکشد. ما به طور غریزی، لحظه به لحظه تنظیم می کنیم.
ما همچنین خسته، حواس پرت و هیجان زده می شویم. وضعیت شناختی ما در طول یک جلسه نوشتن در نوسان است. جملاتی که در ساعت 8 صبح نوشته می شوند دارای الگوهای ریتم متفاوتی نسبت به جملاتی هستند که در نیمه شب نوشته می شوند. هوش مصنوعی چنین نوسانی ندارد.
نتیجه: متن هوش مصنوعی مانند یک مترونوم نوشته شده است. متن انسان مانند جاز خوانده می شود.
آشکارسازها چگونه ترکیدگی را اندازه میگیرند
بیشتر آشکارسازهای هوش مصنوعی ترکیدگی را به عنوان یک عدد مستقل گزارش نمی کنند. در امتیاز کلی آنها در کنار [گیج و معیارهای دیگر] (/blog/what-is-perplexity-ai-detection) قرار می گیرد. اما خود اندازه گیری ساده است.
آشکارساز متن شما را به جملات تقسیم می کند. طول هر جمله را محاسبه می کند - معمولاً در کلمات، گاهی اوقات به صورت نشانه. سپس واریانس یا انحراف استاندارد این طول ها را در سراسر سند کامل محاسبه می کند.
برخی از ابزارها فراتر می روند. آنها نه تنها واریانس طول بلکه واریانس پیچیدگی را اندازه گیری می کنند - ردیابی اینکه آیا جملات شما بین ساختارهای ساده، مرکب و پیچیده جابجا می شوند یا خیر. متنی که به طور متناوب بین «ما این را پیدا کردیم» و «با توجه به محدودیتهای تحمیلشده توسط طرح آزمایشی، همراه با محدودیتهای ذاتی در تحلیل مقطعی، یافتههای ما باید با احتیاط تفسیر شوند» نشاندهنده انفجار بالایی است. متنی که در آن هر جمله از الگوی فاعل-فعل-مفعول-مشخص پیروی می کند، چنین نیست.
GPTZero این را به عنوان یک نمودار پراکنده تجسم می کند - هر جمله با پیچیدگی و طول آن ترسیم می شود. متن انسانی یک ابر پراکنده و نامنظم تولید می کند. متن هوش مصنوعی یک خوشه فشرده ایجاد می کند. تفاوت بصری قابل توجه است.
آشکارسازهای پیشرفته تر نیز به ترکیدگی درون پاراگراف ها در مقابل پاراگراف ها نگاه می کنند. نویسندگان انسانی تمایل دارند که ریتم خود را در یک پاراگراف تغییر دهند - شروع گسترده، مشخص شدن، سپس به یک نتیجه گیری کوتاه. هوش مصنوعی تمایل دارد تا ریتم یکسانی را در سرتاسر حفظ کند.
انفجار در مقابل گیجی: تفاوت چیست؟
این دو معیار اغلب با هم ظاهر می شوند و محققان اغلب آنها را اشتباه می گیرند. تمایز اینجاست.
گیجی قابلیت پیش بینی در سطح کلمه را اندازه گیری می کند. یک مدل زبان از انتخاب هر کلمه چقدر شگفت زده می شود؟ گیجی کم به این معنی است که کلمات قابل پیش بینی بودند. گیجی زیاد یعنی اینطور نبودند.
Burstiness تنوع در سطح جمله را اندازه گیری می کند. جملات چقدر از نظر طول و پیچیدگی با یکدیگر تفاوت دارند؟ ترکیدگی کم به معنای جملات یکنواخت است. ترکیدگی زیاد به معنای تنوع چشمگیر است.
شما می توانید گیجی کم با انفجار زیاد داشته باشید - یک مقاله دانشگاهی که از اصطلاحات استاندارد استفاده می کند اما ساختار جمله خود را به طور چشمگیری تغییر می دهد. همچنین میتوانید با انبوهی کم، گیجی زیاد داشته باشید - متنی خلاقانه با واژگان غیرمعمول اما طول جملات عجیب و غریب.
در عمل، متن تولید شده توسط هوش مصنوعی در هر دو امتیاز پایینی دارد. این ترکیب قوی ترین سیگنال تشخیص است. طبقه بندی متنی که تنها در یک متریک امتیاز پایینی دارد برای آشکارسازها بسیار دشوارتر است.
ما متوجه شدیم که ترکیدگی در واقع معیار سادهتری برای اصلاح در نوشتههای شماست. تغییر طول جمله کاری است که می توانید آگاهانه انجام دهید. تغییر قابلیت پیشبینی در سطح کلمه سختتر است، زیرا نیازمند بازنگری در انتخابهای واژگان در سطح ریز است. Text Humanizer ما به هر دو میپردازد، اما اگر بهصورت دستی ویرایش میکنید، با انفجار شروع کنید.
Add Natural Rhythm to Your Writing
Our text humanizer introduces human-like sentence variation to your academic drafts — keeping your meaning and tone intact.
Try the Text Humanizerاین برای نوشتار دانشگاهی شما چه معنایی دارد
اگر از هوش مصنوعی برای کمک به پیشنویس مقالات خود استفاده میکنید - و میلیونها محقق این کار را انجام میدهند - عملیترین معیار شما، انفجار است. در اینجا دلیل آن است.
شما می توانید بدون تغییر محتوای خود، انفجار را افزایش دهید. ایده ها، استدلال ها و شواهد یکسان باقی می مانند. فقط بسته بندی تغییر می کند. و بر خلاف تنظیمات گیجی، که گاهی اوقات به تغییرات واژگانی نیاز دارند که ممکن است غیرطبیعی به نظر برسند، تنظیمات انفجاری مربوط به ریتم و ساختار است.
در اینجا چیزی است که ما توصیه می کنیم:
** جملات یکنواخت را بشکنید.** پیش نویس خود را بخوانید و به دنبال مواردی باشید که طول هر جمله تقریباً یکسان باشد. وقتی آنها را پیدا کردید - و خواهید یافت - یک جمله را بازنویسی کنید تا بسیار کوتاه باشد. دیگری را به ساختاری طولانی تر و پیچیده تر گسترش دهید.
از قطعات به عمد استفاده کنید. نوشتن آکادمیک اجازه می دهد تا قطعات گاه به گاه برای تاکید استفاده شود. "مهم نیست" می تواند یک جمله باشد. "الگوی واضح" می تواند از یک بیانیه تحلیلی طولانی تر پیروی کند. قطعات ترکیدگی را افزایش می دهند.
گشایش پاراگراف خود را تغییر دهید. اگر هر پاراگراف با یک جمله 12 کلمه ای شروع می شود، الگو را بشکنید. یکی را با یک سوال شروع کنید. یکی دیگر را با یک اعلان سه کلمه ای شروع کنید. سومی را با یک جمله فرعی شروع کنید که قبل از رسیدن به نکته اصلی ساخته می شود.
متن خود را با صدای بلند بخوانید. این قدیمی ترین توصیه نوشتاری به دلایلی است. گوش شما یکنواختی ریتمیک را می گیرد که چشمان شما از آن غافل می شوند. اگر آهنگ خواندن شما مانند تیک تاک ساعت به نظر می رسد - همان ضربان، همان سرعت، تاکید یکسان - شما یک مشکل انفجاری دارید.
برای مطالعه کامل در مورد ساختن پیش نویس های به کمک هوش مصنوعی که واقعاً انسانی به نظر می رسند، به راهنمای ما در مورد [چگونگی انسانی کردن متن هوش مصنوعی] (/blog/how-to-humanize-ai-text) مراجعه کنید.
محدودیت های ترکیدگی به عنوان یک سیگنال تشخیص
ترکیدگی کامل نیست هیچ متریک واحدی وجود ندارد.
برخی از نویسندگان انسانی به طور طبیعی متنی با حجم کم تولید می کنند. اسناد فنی، نگارش حقوقی، و زیرشاخه های علمی خاص دارای قراردادهایی هستند که از ساخت جمله یکسان حمایت می کنند. قرار است بایگانی نظارتی یکنواخت به نظر برسد - این نیاز ژانر است.
ما 15 سند علمی نظارتی نوشته شده توسط انسان را آزمایش کردیم. امتیاز انفجار آنها از خروجی GPT-4o قابل تشخیص نبود. هر یک از آنها روی یک آشکارساز فقط انفجار پرچم گذاری می کردند.
از طرف دیگر، مدلهای جدیدتر هوش مصنوعی در تقلید انفجار بهتر میشوند. Claude و GPT-4o متن متنوع تری نسبت به GPT-3.5 تولید می کنند. شکاف در حال کاهش است. ابزارهای تشخیص باید فراتر از اندازهگیریهای واریانس ساده تکامل یابند تا به این روند ادامه دهند.
سوگیری زبانی نیز وجود دارد. نویسندگان غیر بومی انگلیسی اغلب متنی با حجم کمتر تولید میکنند - نه به این دلیل که از هوش مصنوعی استفاده میکنند، بلکه به این دلیل که نوشتن به زبان دوم تمایل دارد ساختارهای ثابت و تمرینشده را نسبت به تغییرات بداههنویسی یک زبان مادری ترجیح دهد.
این محدودیتها ترکیدگی را بیفایده نمیسازد. آنها آن را یک ابزار در میان چندین ابزار قرار می دهند. بهترین رویکردهای تشخیص - و بهترین رویکردهای انسانی کردن - ترکیدگی را در کنار گیجی، آنتروپی و نشانگرهای سبکی در نظر می گیرند.
پیشنهاد عملی: نوشته های خود را ترکانده کنید
تشخیص هوش مصنوعی از بین نمی رود. نوشتن به کمک هوش مصنوعی هم نیست. سوال عملی این است که چگونه می توان متنی تولید کرد که تفکر واقعی شما را منعکس کند و در عین حال معیارهایی را که موسسات اتخاذ کرده اند را نیز پشت سر بگذارد.
انفجار به شما یک هدف مشخص می دهد. جملات خود را تغییر دهید ریتم را بشکن اجازه دهید نوشته شما نفس بکشد و لکنت داشته باشد و به همان روشی که فکر واقعی انسان در یک صفحه انجام می دهد، کشیده شود.
جمله کوتاه سپس یک برنامه طولانی و مفصل که زمان می برد تا به نقطه اصلی برسد، شرایط و صلاحیت ها را در طول راه بپیماید. سپس متوسط. این یک حیله نیست - این نحوه نوشتن است که مردم در هنگام درگیر شدن با ایده های خود در واقع می نویسند.
تحقیقات شما شایسته این است که به نظر برسد که از یک انسان متفکر انجام شده است. چون این کار را کرد.
Restore natural rhythm and variation to your AI-assisted drafts. Built for researchers who need academic tone preserved.
سوالات متداول
سؤال: چه نمره انفجاری به این معنی است که متن من از تشخیص هوش مصنوعی عبور می کند؟
هیچ آستانه جهانی وجود ندارد زیرا هر آشکارساز میزان ترکیدگی را به طور متفاوتی محاسبه و وزن می کند. به طور کلی، انحراف معیار طول جمله بالاتر از 7 کلمه را هدف قرار دهید - اینجاست که ما شاهد خوشه بندی متون آکادمیک نوشته شده توسط انسان در آزمون خود هستیم. اما ترکیدگی به تنهایی نتیجه تشخیص شما را تعیین نمی کند. ابزارها آن را با گیجی، تحلیل واژگان و سایر سیگنال ها ترکیب می کنند. به جای زدن یک عدد خاص، بر روی تنوع واقعی متن خود تمرکز کنید.
سؤال: آیا می توانم فقط با افزودن جملات کوتاه، پارگی را افزایش دهم؟
افزودن چند جمله کوتاه کمک می کند، اما به تنهایی کافی نیست. آشکارسازها به توزیع کامل طول جملات نگاه می کنند، نه فقط به وجود موارد کوتاه. اگر 25 جمله با میانگین 18 کلمه داشته باشید و سه جمله 4 کلمه ای اضافه کنید، واریانس کلی فقط کمی افزایش می یابد. شما به تنوع در سراسر نیاز دارید - برخی بسیار کوتاه، برخی کاملاً طولانی، بیشتر در جایی در میان، بدون الگوی واضح برای توزیع.
سؤال: آیا انفجار برای تشخیص هوش مصنوعی مهمتر از گیجی است؟
هیچ یک از متریک ها به خودی خود تسلط ندارند. در آزمایش ما، متون با امتیازات پایین در هر دو معیار به طور مداوم علامت گذاری شدند - بیش از 90٪ مواقع در هر پنج آشکارساز که ارزیابی کردیم. متنهایی با گیجی کم اما ترکیدگی زیاد در حدود 40 درصد مواقع علامتگذاری میشدند. متون با گیجی زیاد اما ترکیدگی کم حدود 35 درصد پرچم گذاری شدند. این ترکیب بیش از هر یک از معیارها به صورت جداگانه اهمیت دارد.
سؤال: آیا همه مدلهای هوش مصنوعی متنی با انفجار کم تولید میکنند؟
بیشتر این کار را انجام می دهند، اما مدرک تحصیلی متفاوت است. GPT-3.5 متن قابل توجهی صاف تر از GPT-4o تولید کرد. کلود در آزمایش ما به سمت ترکیدگی کمی بیشتر از مدل های GPT تمایل دارد. با این حال، هیچ یک از مدلهای اصلی با دامنه انبوهی نوشتههای انسانی مطابقت ندارند، بدون اینکه درخواست خاصی برای تغییر ساختار جمله داشته باشند. حتی با وجود چنین اغراضی، این تنوع همچنان مصنوعی به نظر می رسد - برنامه ای به جای ارگانیک.

Ema is a senior academic editor at ProofreaderPro.ai with a PhD in Computational Linguistics. She specializes in text analysis technology and language models, and is passionate about making AI-powered tools that truly understand academic writing. When she's not refining proofreading algorithms, she's reviewing papers on NLP and discourse analysis.