نئے اور حقیقی مواد کے ساتھ زبانیں قدرتی طور پر سیکھیں!

علاقے کے لحاظ से دریافت करें

AI سٹارٹ اپ Galileo Technologies کی درجہ بندی Claude 3.5 Sonnet، Google کی Gemini، اور Alibaba کی Qwen2-72B-Instruct کو ہیلوسینیشن انڈیکس بینچ مارک میں سرفہرست ہے۔ AI startup Galileo Technologies ranks Claude 3.5 Sonnet, Google's Gemini, and Alibaba's Qwen2-72B-Instruct top in the Hallucination Index benchmark.

flag AI سٹارٹ اپ Galileo Technologies نے ایک نئے بینچ مارک ٹیسٹ، ہیلوسینیشن انڈیکس میں مڈرینج اور اوپن سورس بڑے لینگویج ماڈلز کی درجہ بندی کی ہے۔ flag AI startup Galileo Technologies has ranked midrange and open-source large language models highly in a new benchmark test, the Hallucination Index. flag بینچ مارک، جو کہ 22 معروف جنریٹو AI ماڈلز کا جائزہ لیتا ہے، نے تین ٹاسک کلیکشنز میں ان کی درستگی کی پیمائش کی۔ flag The benchmark, which evaluates 22 leading generative AI models, measured their accuracy across three task collections. flag اینتھروپک کا کلاڈ 3.5 سونیٹ درجہ بندی میں سرفہرست رہا، جبکہ گوگل کے جیمنی 1.5 فلیش نے قیمت پر بہترین کارکردگی کا مظاہرہ کیا۔ flag Anthropic's Claude 3.5 Sonnet topped the ranking, while Google's Gemini 1.5 Flash performed best on cost. flag Alibaba کا Qwen2-72B-Instruct سب سے زیادہ کارکردگی کا مظاہرہ کرنے والا اوپن سورس ماڈل تھا۔ flag Alibaba's Qwen2-72B-Instruct was the top-performing open-source model.