Google ul çmimet e Gemini 1.5 Flash duke ndezur luftën e çmimeve të LLM
Në maj, Google prezantoi modelin e ri Gemini 1.5 Flash të optimizuar për shpejtësi dhe efikasitet. Gemini 1.5 Flash kishte një çmim agresiv (0,35 dollarë për milion argumente hyrëse dhe 1,05 dollarë për milion argumente dalëse) krahasuar me modelet e tjera kufitare, duke përfshirë Gemini 1.5 Pro të vetë Google. Muajin e kaluar, OpenAI njoftoi modelin e ri GPT-4o Mini për të konkurruar drejtpërdrejt me Gemini 1.5 Flash, duke ulur çmimin e tij me 0,15 dollarë për milion shenja hyrëse dhe 0,6 dollarë për milion argumente dalëse.
Sot, Google uli çmimin e modelit Gemini 1.5 Flash me rreth 80%, duke filluar nga 12 gusht 2024. Kostoja e re do të jetë 0,075 dollarë për milion argumente hyrëse dhe 0,3 dollarë për milion argumente dalëse, duke e bërë Gemini 1.5 Flash gati 50% më të lirë se ai i OpenAI GPT-4o mini. Ky çmim i reduktuar së bashku me veçori të tilla si memoria e kontekstit mund të zvogëlojë ndjeshëm koston dhe vonesën e pyetjeve të kontekstit të gjatë. Thirrjet Batch API mund të ulin më tej kostot për detyrat me vonesë intensive.
Sa i përket performancës, Gemini 1.5 Flash ende mbetet pas GPT-4o mini. Siç tregon tabela më poshtë, GPT-4o mini tejkalon Gemini 1.5 Flash në të gjitha standardet kryesore të AI, përveç MathVista.
Ndërsa ulja e çmimit është e dobishme për zhvilluesit dhe ndërmarrjet, ajo paraqet një sfidë të rëndësishme për startup-et më të vogla të AI që konkurrojnë kundër gjigantëve të industrisë si Google dhe OpenAI. Fillesat, modelet e biznesit të të cilëve përqendrohen në zhvillimin dhe shërbimin e LLM-ve nëpërmjet API-ve, mund ta kenë gjithnjë e më të vështirë të mbeten të zbatueshëm në luftën aktuale të çmimeve. Për më tepër, publikimi i fundit i modeleve kufitare LLama 3.1 me burim të hapur të Meta intensifikon më tej peizazhin konkurrues. Në këtë treg në zhvillim, startup-et do të duhet të demonstrojnë inovacion ose diferencim domethënës për të siguruar qëndrueshmërinë e tyre afatgjatë.
Së bashku me uljen e çmimit, Google gjithashtu njoftoi se modeli Gemini 1.5 Flash tani mund të kuptojë dhe të përgjigjet në mbi 100 gjuhë. Për më tepër, disponueshmëria e përgjithshme e xhiros së ofruar i lejon zhvilluesit të shkallëzojnë përdorimin e tyre të modeleve si Gemini 1.5 Flash, duke siguruar si kapacitetin ashtu edhe parashikueshmërinë e çmimeve.