وسایل نقلیه خودران با ChatGPT
وسایل نقلیه خودران با ChatGPT
وسایل نقلیه خودران با ChatGPT می توانند مسافران خود را بهتر درک کنند
پژوهشگران دانشگاه پردو دریافتهاند که یک وسیله نقلیه خودران (AV) میتواند با کمک چتبات هایی مانند ChatGPT به طور مؤثری به دستورات مسافران پاسخ دهد و آنها را به مسیرهای بهینه هدایت کند .
این تحقیق که در تاریخ ۲۵ سپتامبر در بیست و هفتمین کنفرانس بینالمللی IEEE درباره سیستمهای حملونقل هوشمند ارائه خواهد شد ، ممکن است یکی از نخستین آزمایشها در زمینه بررسی قابلیت یک AV در استفاده از مدلهای زبانی بزرگ برای تفسیر دستورات مسافران و رانندگی بر اساس آنها باشد .
دکتر زیران وانگ ، استادیار در دانشکده مهندسی عمران و ساخت دانشگاه پردو و نویسنده اصلی این مطالعه ، معتقد است که برای اینکه وسایل نقلیه یک روز به طور کامل خودران شوند ، باید همه چیزهایی را که مسافران میگویند ، حتی زمانی که دستورات ضمنی هستند ، درک کنند . به عنوان مثال ، یک راننده تاکسی میداند که شما چه نیاز دارید وقتی میگویید که در عجله هستید ، بدون اینکه مجبور باشید مسیری که باید انتخاب کند را مشخص کنید .
با اینکه وسایل نقلیه خودران امروزی دارای ویژگیهایی هستند که به شما اجازه میدهند با آنها ارتباط برقرار کنید ، اما نیاز به وضوح بیشتری دارند تا بتوانند شما را درک کنند . در مقابل ، مدلهای زبانی بزرگ میتوانند به طور طبیعی و انسانیتر به دستورات پاسخ دهند زیرا آموزشدیدهاند که روابط را از حجم وسیعی از دادههای متنی کشف کنند و به مرور زمان یاد بگیرند .
وانگ گفت : « سیستمهای مرسوم در وسایل نقلیه ما طراحی رابط کاربری دارند که شما باید دکمههایی را فشار دهید تا خواستههای خود را منتقل کنید ، یا یک سیستم تشخیص صوتی که نیاز به صحبت کردن بسیار واضح دارد تا وسیله نقلیه شما بتواند شما را درک کند . اما قدرت مدلهای زبانی بزرگ این است که میتوانند به طور طبیعی انواع مختلفی از چیزهایی را که میگویید ، درک کنند. من فکر نمیکنم هیچ سیستم دیگری بتواند این کار را انجام دهد . »
در این مطالعه ، مدلهای زبانی بزرگ خودران را هدایت نکردند ، بلکه به رانندگی AV با استفاده از ویژگیهای موجود آن کمک کردند . وانگ و دانشجویانش از طریق ادغام این مدلها متوجه شدند که یک AV میتواند نه تنها بهتر مسافر را درک کند بلکه رانندگی آن را به سلیقه مسافر نیز شخصیسازی کند .
قبل از شروع آزمایشهای خود ، محققان ChatGPT را با درخواستهایی آموزش دادند که از دستورات مستقیم (مانند « لطفاً سریعتر رانندگی کنید ») تا دستورات غیرمستقیم (مانند «حس میکنم کمی حالت تهوع دارم») متغیر بود . به محض اینکه ChatGPT یاد گرفت چگونه به این درخواستها پاسخ دهد ، محققان پارامترهایی را به مدلهای زبانی بزرگ ارائه کردند که شامل در نظر گرفتن قوانین ترافیکی ، شرایط جاده ، آب و هوا و اطلاعات دیگر کشفشده توسط حسگرهای وسیله نقلیه ، مانند دوربینها و تشخیص و فاصلهی نوری میشد .
سپس ، محققان این مدلهای زبانی بزرگ را از طریق ابر به یک وسیله نقلیه با سطح چهار خودران طبق تعریف SAE International دسترسی دادند . سطح چهار یک سطح نزدیک به آنچه صنعت به عنوان وسیله نقلیه کاملاً خودران در نظر میگیرد ، است.
هنگامی که سیستم تشخیص گفتار وسیله نقلیه در طول آزمایشها یک دستور از مسافر شناسایی کرد ، مدلهای زبانی بزرگ در ابر آن دستور را با پارامترهایی که محققان تعریف کرده بودند ، تجزیه و تحلیل کردند . سپس این مدلها دستورالعملهایی برای سیستم رانندگی وسیله نقلیه تولید کردند که به گاز ، ترمز ، دنده و فرمان متصل بود ، تا بر اساس آن دستور عمل کند .
در برخی از آزمایشها ، تیم وانگ همچنین یک ماژول حافظه را آزمایش کرد که به مدلهای زبانی بزرگ اجازه میداد دادههای مربوط به ترجیحات تاریخی مسافر را ذخیره کند و یاد بگیرد چگونه آنها را در پاسخ به یک دستور در نظر بگیرد .
محققان بیشتر آزمایشهای خود را در یک مرکز آزمایشی در کلمبوس ، ایندیانا ، که قبلاً باند فرودگاه بود ، انجام دادند . این محیط به آنها اجازه داد تا به طور ایمن پاسخهای وسیله نقلیه را به دستورات مسافر در حال رانندگی با سرعتهای بزرگراهی و در تقاطعهای دوطرفه آزمایش کنند. آنها همچنین آزمایش کردند که وسیله نقلیه چگونه میتواند بر اساس دستورات مسافر پارک کند.
شرکتکنندگان در مطالعه از هر دو نوع دستوری که مدلهای زبانی بزرگ یاد گرفته بودند و دستورات جدید در حین سوار شدن به وسیله نقلیه استفاده کردند. بر اساس پاسخهای نظرسنجی آنها بعد از سواری، شرکتکنندگان نسبت به تصمیمات AV احساس راحتی بیشتری داشتند در مقایسه با دادهها در مورد اینکه مردم معمولاً هنگام سوار شدن به یک AV سطح چهار بدون کمک از مدلهای زبانی بزرگ چه احساسی دارند.
تیم همچنین عملکرد AV را با مقادیر پایهای که از دادهها در مورد اینکه مردم به طور متوسط چه چیزی را ایمن و راحت میدانند، مقایسه کرد. آنها دریافتند که AV در این مطالعه از تمام مقادیر پایهای در حالی که از مدلهای زبانی بزرگ برای رانندگی استفاده میکند، بهتر عمل کرده است، حتی زمانی که به دستورات مدلهایی پاسخ میدهد که قبلاً یاد نگرفته بودند.
جهتگیریهای آینده
مدلهای زبانی بزرگ در این مطالعه به طور متوسط ۱.۶ ثانیه برای پردازش یک دستور مسافر زمان نیاز داشتند که در سناریوهای غیرزمانی قابل قبول است، اما باید برای شرایطی که یک AV نیاز به پاسخ سریعتری دارد، بهبود یابد. وانگ گفت که این یک مشکل عمومی برای مدلهای زبانی بزرگ است و در حال حاضر هم توسط صنعت و هم توسط پژوهشگران دانشگاهی در حال حل است.
با اینکه این موضوع در کانون توجه این مطالعه نیست، اما مشخص است که مدلهای زبانی بزرگ مانند ChatGPT مستعد «هذیان» هستند، به این معنی که ممکن است چیزی را که آموختهاند به اشتباه تفسیر کنند و به شیوهای نادرست پاسخ دهند.
مطالعه وانگ در یک چارچوب با مکانیزم ایمنی انجام شد که به شرکتکنندگان اجازه میدهد به طور ایمن سوار شوند حتی زمانی که مدلهای زبانی بزرگ دستورات را اشتباه فهمیدند. این مدلها در طول سواری یک شرکتکننده درک خود را بهبود بخشیدند، اما هذیان همچنان یک مشکل است که باید قبل از اینکه تولیدکنندگان خودرو بخواهند مدلهای زبانی بزرگ را به AVها اضافه کنند، به آن رسیدگی شود.
تولیدکنندگان خودرو همچنین باید آزمایشهای بیشتری با مدلهای زبانی بزرگ انجام دهند، علاوه بر مطالعاتی که پژوهشگران دانشگاهی انجام دادهاند. همچنین تأیید مقررات برای ادغام این مدلها با کنترلهای AV لازم است تا آنها بتوانند واقعاً خودرو را برانند، گفت وانگ.
در همین حال، وانگ و دانشجویانش همچنان به انجام آزمایشهایی ادامه میدهند که ممکن است به صنعت در بررسی افزودن مدلهای زبانی بزرگ به AVها کمک کند.
از زمان آزمایش ChatGPT، پژوهشگران مدلهای چت عمومی و خصوصی دیگر مبتنی بر مدلهای زبانی بزرگ را نیز ارزیابی کردهاند، مانند Gemini گوگل و سری دستیارهای Llama متا. تا کنون، آنها دیدهاند که ChatGPT بهترین عملکرد را در شاخصهای مربوط به یک سفر ایمن و کارآمد در AV دارد. نتایج منتشر خواهد شد.
یکی از مراحل بعدی بررسی این است که آیا امکان برقراری ارتباط بین مدلهای زبانی بزرگ هر AV وجود دارد، به عنوان مثال، برای کمک به AVها در تعیین اینکه کدام باید در یک توقف چهارطرفه اول برود. آزمایشگاه وانگ همچنین در حال شروع یک پروژه برای مطالعه استفاده از مدلهای بینایی بزرگ برای کمک به AVها در رانندگی در شرایط جوی زمستانی شدید است که در سرتاسر میانه غرب شایع است.
این مدلها مشابه مدلهای زبانی بزرگ هستند اما بر روی تصاویر آموزش دیدهاند. این پروژه با حمایت از مرکز حملونقل متصل و خودکار (CCAT) که توسط دفتر تحقیق، توسعه و فناوری وزارت حملونقل ایالات متحده تأمین مالی میشود، انجام خواهد شد. پردو یکی از دانشگاههای همکار CCAT است.
دیدگاهتان را بنویسید