Google-მა Gemma 3 გამოუშვა

ღია კოდის AI მოდელების სერიის ახალი გამოშვებაა, რომელიც მაღალ დონეზე მუშაობას გვპირდება. ტექსტისა და ფოტოების დამუშავების უნარისა თუ 140-ზე მეტი ენის მხარდაჭერით მოდელი გუგლის მიზანს ემსახურება, გახადოს AI მეტად ხელმისაწვდომი მოწყობილობებისა და აპლიკაციების ფართო სპექტრში.
Gemma 3-ის ერთ-ერთი მნიშვნელოვანი განახლება მისი ეფექტურობაა — DeepSeek R1-ის სიზუსტის 98%-ს აღწევს და ბევრად ნაკლები გამოთვლითი რესურსი სჭირდება. ეს კი დისტილაციის ტექნოლოგიით მიიღწევა, რა დროსაც დიდი ენობრივი მოდელების ცოდნა შეკუმშულია და პატარად გვევლინება.
ამასთან, გუგლმა მნიშვნელოვნად გააუმჯობესა სწავლის ტექნიკებიც, Human Feedback (RLHF), Machine Feedback (RLMF) და Execution Feedback (RLEF) დაამატა, რათა მათემატიკის, კოდირებისა და ლოგიკური უნარები დაეხვეწა.
Gemma 3 ოთხ ზომაშია ხელმისაწვდომი, დაწყებული 1 მილიარდიდან 27 მილიარდ პარამეტრამდე, ახალი მოდელი ცდილობს, ძლიერი დასაბუთებისა და მულტიმოდალური უნარები შემოგვთავაზოს ისე, რომ ცალკეულ GPU-სა თუ TPU-ზეც მუშაობდეს.
ხოლო მათ, ვინც მობილურ და ვებ აპლიკაციებთან მუშაობს, Gemma 3-ის პატარა ერთ მილიარდ პარამეტრიანი მოდელი კომპაქტურ, მაგრამ ძლიერ გადაწყვეტას წარმოადგენს — მხოლოდ 529MB-ია და ტექსტების გენერირება წამში 2585 ტოკენის სიჩქარით შეუძლია, რითაც მიმზიდველი ხდება დეველოპერებისთვის, რომლებსაც პროცესში ნაკლები ძალისხმევის დახარჯვა სურთ.
მოდელის ფართოდ დასანერგად კი გუგლი მკვლევრებს AI ექსპერიმენტისთვის 10 000-დოლარიან კრედიტებს აძლევს…