Deciziile agențiilor generează o creștere a cheltuielilor corporațiilor, iar acestea au început să plătească mai atent pentru implementarea IA. În mare parte, acest lucru a fost influențat de politica dezvoltatorilor de IA precum OpenAI și Anthropic, care, după analiza propriilor costuri, au realizat că subvenționează mulți clienți, oferindu-le acces aproape nelimitat la resursele de calcul în cadrul abonamentului. Mulți clienți consumă atât de multe tokenuri, încât cheltuielile nu sunt acoperite de plățile sub formă de abonament. Trecerea la plata proporțională a resurselor de calcul a șocat mulți clienți. De exemplu, un mic dezvoltator de software, Workato, a raportat că, după trecerea la plata proporțională a tokenilor, cheltuielile pentru serviciile furnizorilor de IA au crescut de șapte ori în prima zi. Era evident că trebuia să se facă ceva, iar conducerea companiei a început să analizeze de două ori pe săptămână posibilitățile de economisire a utilizării IA. În general, așa cum subliniază Financial Times, tactica consumatorilor de sisteme IA se concentrează atât pe limitarea utilizării instrumentelor externe, pentru care trebuie plătit, cât și pe căutarea unor alternative mai ieftine. În unele cazuri, aceste alternative sunt fie modele IA cu sursă deschisă desfășurate pe propria infrastructură, fie sisteme mai accesibile dezvoltate de companii chineze. În condițiile accesului la distanță, soluțiile chineze pot fi mai ieftine, cel puțin datorită tarifelor mai mici la energie electrică din China. De la începutul acestui an, modelele IA chineze au depășit modelele americane în ceea ce privește volumul de consum al tokenurilor. Unii reprezentanți ai afacerilor au impus limite de cheltuieli pentru utilizarea IA externe de către angajații lor. De exemplu, la Uber, această sumă este limitată la 1.500 de dolari pe angajat pe lună. Cheltuielile au crescut pe măsură ce utilizatorii au trecut de la interacțiuni simple cu chatbot-uri la utilizarea mai multor agenți IA. Pe un angajat din organizație pot exista între 10 și 10.000 de agenți, iar toți consumă continuu tokenuri, pentru care trebuie plătit. Analiștii Goldman Sachs se așteaptă ca, până în 2030, consumul de tokenuri IA să crească de 24 de ori, iar acest lucru va agrava deficitul de cipuri în următoarele un an și jumătate. Chiar și companiile care dispun de propria infrastructură de calcul, precum Amazon (AWS), au început să monitorizeze eficiența utilizării resurselor. Acest gigant al cloud-ului a început să combată demonstrarea fictivă a unei activități IA intense de către unii angajați, care sperau să demonstreze conducerii loialitatea față de ideea de a se implica în această activitate. Meta a fost nevoită să urmeze exemplul competitorului în aprilie acestui an. În orice caz, chiar și Amazon și Meta depind de furnizori externi precum Anthropic, pentru serviciile cărora trebuie plătit la tarife comerciale. Microsoft a început să ofere clienților care doresc să optimizeze costurile pentru IA un nou serviciu care permite alegerea optimă a resurselor utilizate. Dacă pentru rezolvarea unei sarcini este suficient să se utilizeze un model mai ieftin, atunci acesta este ales, în loc să se opteze pentru cel mai scump pentru client. Uneori, în cadrul rutării manuale a cererilor, companiile preferă să utilizeze modele IA mai vechi și mai ieftine, fără a urmări cele mai avansate. În ciuda acestui fapt, în interiorul companiilor există întotdeauna utilizatori care nu dispun de resursele de calcul necesare pentru a-și rezolva sarcinile. Companiilor publice le devine din ce în ce mai greu să justifice cheltuielile în creștere pentru IA în fața acționarilor și investitorilor.
Companiile au început să-și monitorizeze cheltuielile pentru implementarea IA
Deciziile agențiilor au dus la creșterea cheltuielilor companiilor, care acum plătesc mai atent pentru implementarea IA. De exemplu, dezvoltatorul de software Workato a raportat o creștere de șapte ori a cheltuielilor în prima zi după trecerea la plata proporțională a tokenilor. Analizând costurile, companiile caută alternative mai ieftine, inclusiv modele IA cu sursă deschisă sau soluții din China.





