AI سٹارٹ اپ Galileo Technologies کی درجہ بندی Claude 3.5 Sonnet، Google کی Gemini، اور Alibaba کی Qwen2-72B-Instruct کو ہیلوسینیشن انڈیکس بینچ مارک میں سرفہرست ہے۔
AI سٹارٹ اپ Galileo Technologies نے ایک نئے بینچ مارک ٹیسٹ، ہیلوسینیشن انڈیکس میں مڈرینج اور اوپن سورس بڑے لینگویج ماڈلز کی درجہ بندی کی ہے۔ بینچ مارک، جو کہ 22 معروف جنریٹو AI ماڈلز کا جائزہ لیتا ہے، نے تین ٹاسک کلیکشنز میں ان کی درستگی کی پیمائش کی۔ اینتھروپک کا کلاڈ 3.5 سونیٹ درجہ بندی میں سرفہرست رہا، جبکہ گوگل کے جیمنی 1.5 فلیش نے قیمت پر بہترین کارکردگی کا مظاہرہ کیا۔ Alibaba کا Qwen2-72B-Instruct سب سے زیادہ کارکردگی کا مظاہرہ کرنے والا اوپن سورس ماڈل تھا۔
July 29, 2024
3 مضامین