ექსპერიმენტის თანახმად, ხელოვნური ინტელექტის სიცრუეში დარწმუნება შეგვიძლია

ექსპერიმენტის თანახმად, ხელოვნური ინტელექტის სიცრუეში დარწმუნება შეგვიძლია
ფოტო: Nextiva
8
წაკითხვა
ახალი ექსპერიმენტის ავტორებმა ხუთ წამყვან ჩატბოტს ფილმებიდან ან ნოველებიდან ისეთი სცენების აღწერა სთხოვეს, რომლებიც საერთოდ არ არსებობს.
ერთ-ერთმა მკვლევარმა ChatGPT-ს ჰკითხა, რომელი იყო ბოტის საყვარელი სცენა ფილმიდან “ჭკვიანი უილ ჰანტინგი”. ამის შემდეგ მეცნიერმა იკითხა, “იმ სცენაზე რას იტყვი, რომელშიც ჰიტლერია ნახსენები?” ფილმში ასეთი სცენა საერთოდ არ არსებობს, თუმცა ჩატბოტმა ეს “სცენა” მაინც თავდაჯერებით აღწერა.
ამას -ჰალუცინაციას უწოდებენ. ზოგადად, ფილმებში ჰიტლერს ხშირად ახსენებენ. ალბათ, სწორედ ამან დაარწმუნა ჩატბოტი, მკვლევრის მიერ მიწოდებული მცდარი აზრი მიეღო და განევრცო, ნაცვლად იმისა, რომ შეესწორებინა.
ამის შემდეგ მკვლევრებმა ახალი მიდგომა შეიმუშავეს. ისინი 5 წამყვან ჩატბოტს 1000 პოპულარულ ფილმსა და 1000 პოპულარულ ნოველაზე გაესაუბრნენ. მიმოწერის დროს მათ სარწმუნო, თუმცა მცდარი აზრები გამოთქვეს, მაგალითად, ჰიტლერი, დინოზავრები ან დროის მანქანები ახსენეს იმ ფილმებთან და ნოველებთან მიმართებით, რომლებშიც ისინი საერთოდ არ ფიგურირებს. მკვლევრების მიერ წინადადების ფორმულირება ძირითადად შემდეგნაირი იყო: “მე პირადად ძალიან მიყვარს ის სცენა, რომელშიც…”
მეთოდი სამი ეტაპისგან შედგება. თავდაპირველად გარკვეული თემის შესახებ აგენერირებს წინადადებებს. თემაში წიგნი ან ფილმი იგულისხმება. ზოგი წინადადება ჭეშმარიტია, ზოგიც მცდარი. მეორე ეტაპზე ცალკე მიმოწერას ხსნიან, რომელშიც AI ამ წინადადებების სისწორეს ამოწმებს. საბოლოო ეტაპზე მოდელის წინააღმდეგ არგუმენტებად თავად ამ მოდელის დაგენერირებული წინადადებები მოჰყავთ. მიზანი იმის შემოწმებაა, აღიარებს თუ შეეწინააღმდეგება მოდელი მათ.
აღმოჩნდა, რომ მაშინაც კი, როცა მოდელი თავდაპირველად წინადადებას მცდარად აღიარებს, საკმარისი წნეხის ქვეშ შეიძლება ის ჭეშმარიტად მიიჩნიოს.
ფილმებზე ან ნოველებზე საუბრისას ჩატბოტის მიერ აზრის შეცვლა შეიძლება უწყინარი ჩანდეს. მეორე მხრივ, სერიოზულ თემებზე საუბრისას, მაგალითად, ჯანმრთელობაზე ან სამართალზე, ამ ტენდენციამ შეიძლება მნიშვნელოვანი ზიანი მოგვიტანოს. ამის გამო მკვლევრები მიიჩნევენ, რომ არამხოლოდ ის უნდა კონტროლდებოდეს უკეთ, თუ რაზე იწვრთნება AI-სისტემები, არამედ ისიც, თუ რამდენად შეუძლია ამ მოდელებს საკუთარი აზრის შენარჩუნება.
აღსანიშნავია, რომ ყველა ჩატბოტი თანაბრად არ აღმოჩნდა ტყუილის მიღებისკენ მიდრეკილი. მაგალითად, Claude ყველაზე “გამძლე” აღმოჩნდა, Grok და ChatGPT — შედარებით ნაკლებად, Gemini და DeepSeek კი ყველაზე მალე “გატყდა”. უცნობია, რა იწვევს ჩატბოტებს შორის ამ სხვაობას.
ისიც უნდა ითქვას, რომ ამ ნაშრომში მკვლევრებმა ფილმები და ნოველები გამოიყენეს. შესაძლოა, ჩატბოტებმა უფრო “სერიოზული” თემების კონტექსტში წნეხს მეტად ან ნაკლებად გაუძლოს. მკვლევრები თავიანთ მიგნებებს უფრო დეტალურად Annual Meeting of the Association for Computational Linguistics-ზე წარმოადგენენ, რომელიც ივლისში გაიმართება.
თუ სტატიაში განხილული თემა და ხელოვნური ინტელექტის სფერო შენთვის საინტერესოა, შემოგვიერთდი ჯგუფში, სადაც ვლაპარაკობთ ხელოვნურ ინტელექტზე.
კომენტარები
კვირის ტოპ-5
ტესტი: გამოიცანი პლანეტის ტიპი მხოლოდ ერთი მინიშნებით2155 ნახვა
მეცნიერებმა იპოვეს შუა საუკუნეების დოკუმენტი, რომელშიც შავ ჭირს გადარჩენილი ადამიანების სიაა1963 ნახვა
რატომ არ შეიძლება ზღვის წყლის დალევა?1881 ნახვა
რატომ გახდა მარჯვენა ხელი დომინანტური — მეცნიერებს ახალი ჰიპოთეზა აქვთ1713 ნახვა
ქვიზი: გამოიცანი მეცნიერი აღმოჩენით1606 ნახვა
გირჩევთ
გადახედვა
ფლორა და ფაუნა
როგორ გახდა საბავშვო ბაღის მასწავლებელი 200 სამეფო პინგვინის მფარველი
როგორ გახდა საბავშვო ბაღის მასწავლებელი 200 სამეფო პინგვინის მფარველი
ტექნოლოგიები
სამაგისტრო კურსის ციფრული ტრანსფორმაცია — როცა თეორია პრაქტიკად იქცევა
სამაგისტრო კურსის ციფრული ტრანსფორმაცია — როცა თეორია პრაქტიკად იქცევა
გადახედვა
მეცნიერება
მეცნიერებმა კვერცხის ხელოვნური “ნაჭუჭიდან” წიწილები გამოჩეკეს
მეცნიერებმა კვერცხის ხელოვნური “ნაჭუჭიდან” წიწილები გამოჩეკეს
გადახედვა

ხელოვნურმა ინტელექტმა მეცნიერებს ასაკობრივი უსინათლობის სამკურნალო საშუალება შესთავაზა
ხელოვნურმა ინტელექტმა მეცნიერებს ასაკობრივი უსინათლობის სამკურნალო საშუალება შესთავაზა
Next საქართველო
ვაშლოვანი | მოგზაურობა საქართველოს ცოცხალ უდაბნოში — მომთაბარე პოდკასტი #2
ვაშლოვანი | მოგზაურობა საქართველოს ცოცხალ უდაბნოში — მომთაბარე პოდკასტი #2
გადახედვა
კოსმოსი
22 მაისს მეგარაკეტა Starship V3-ს გაუშვებენ — როგორ ვუყუროთ
22 მაისს მეგარაკეტა Starship V3-ს გაუშვებენ — როგორ ვუყუროთ
გადახედვა
ტექნოლოგიები
Meta-მ 8000 თანამშრომელი გაათავისუფლა
Meta-მ 8000 თანამშრომელი გაათავისუფლა
გადახედვა
ტექნოლოგიები
Kingdom Come-ის სტუდია ბეჭდების მბრძანებლის როლურ თამაშს ამზადებს
Kingdom Come-ის სტუდია ბეჭდების მბრძანებლის როლურ თამაშს ამზადებს
გადახედვა
მეცნიერება
ისტორიაში პირველად, მეცნიერებმა აზრების წარმოქმნის ნეირონული სისტემა აღწერეს
ისტორიაში პირველად, მეცნიერებმა აზრების წარმოქმნის ნეირონული სისტემა აღწერეს
გადახედვა
ადამიანი
ახალი მოხსენების თანახმად, მზისგან დამცავები შეიძლება მავნე ნივთიერებებს შეიცავდეს
ახალი მოხსენების თანახმად, მზისგან დამცავები შეიძლება მავნე ნივთიერებებს შეიცავდეს