تا همین اواخر تصور ما از صدای هوش مصنوعی صدایی رباتیک و بی روح مانند سیری یا الکسا بود. اما یک تحقیق جدید نشان می دهد که این دوران به پایان رسیده است: شنونده عادی دیگر قادر به تشخیص تفاوت بین صدای واقعی یک انسان و نسخه صوتی ساخته شده با هوش مصنوعی (دیپ فیک) نیست. به گزارش لایوساینس، محققان دانشگاه کویین مری لندن در تحقیق حاضر از شرکت کنندگان خواستند تا به 80 نمونه صوتی گوش دهند و بگویند که کدام یک واقعی و کدام یک ساخته هوش مصنوعی است. نتایج نگران کننده بود. زمانی که هوش مصنوعی صدایی را از ابتدا می ساخت، شرکت کنندگان در اکثر موارد (حدود 59 درصد) می توانستند آن را به درستی تشخیص دهند. اما زمانی که هوش مصنوعی صدای یک انسان واقعی را کلون می کرد، نتایج کاملاً متفاوت بود. در این حالت، شرکت کنندگان در 58 درصد موارد، صدای جعلی را به عنوان صدای واقعی انسان اشتباه می گرفتند. و وضعیت کسانی که موفق به تشخیص صدای هوش مصنوعی می شدند نیز از نظر آماری آنچنان متفاوت نبود که چیزی فراتر از صرف حدس زدن را نشان دهد. عدم تشخیص صدای هوش مصنوعی از صدای انسان اینکه هوش مصنوعی می تواند به راحتی صدای انسان را تقلید کند، پیامدهای بسیار خطرناکی برای امنیت، اخلاق و کپی رایت دارد. این فناوری می تواند به ابزاری قدرتمند در دست کلاهبرداران تبدیل شود. ما همین حالا نیز شاهد نمونه های واقعی از این سوءاستفاده ها هستیم. خلافکاران می توانند با شبیه سازی صدای شما پروتکل های احراز هویت صوتی در بانک ها را دور بزنند یا با اعضای خانواده تان تماس بگیرند و با صحنه سازی یک موقعیت اضطراری از آنها پول اخاذی کنند. (مانند موردی که در آن، زنی به نام شارون برایت ول با شنیدن صدای گریه دخترش که با هوش مصنوعی ساخته شده بود، 15 هزار دلار از دست داد). همچنین می توان از این فناوری برای ساخت مصاحبه ها یا بیانیه های جعلی از سیاستمداران و افراد مشهور استفاده کرد تا آن ها را بی اعتبار یا ناآرامی اجتماعی ایجاد کرد (مانند موردی که در آن، از کلون صوتی نخست وزیر کویینزلند برای تبلیغ یک کلاهبرداری بیت کوین استفاده شد). شاید نگران کننده ترین بخش این تحقیق، سادگی و در دسترس بودن این فناوری باشد. محققان تأکید می کنند که کلون های صوتی استفاده شده در این مطالعه، حتی چندان پیچیده هم نبودند. آنها این صداها را با استفاده از نرم افزارهای تجاری در دسترس، با کمترین تخصص فنی، با استفاده از تنها چند دقیقه فایل صوتی از صدای یک فرد و تقریباً بدون هیچ هزینه ای ساخته بودند. این یعنی این ابزار قدرتمند اکنون در دسترس هر کسی قرار دارد. یافته های این تحقیق در ژورنال PLoS One منتشر شده است. |