AI muhandisining yuksalishi
Favqulodda paydo bo‘layotgan imkoniyatlar yangi sarlavhani yaratmoqda: shunchaki Prompt muhandisligidan tashqariga chiqib, haqiqiy dasturlar yozishimiz kerak.
Haqiqiy maqola Shawn Wang (swyx) tomonidan latent.space saytida 2023-yil 30-iyunda e’lon qilingan. Abror Shopulatov tomonidan tarjima va tahrir qilindi.
Biz poydevor modellarining (Foundation Models) imkoniyatlari va ochiq manbaliligi (open source) yoki API mavjudligi uchun AI’ni amalda qo‘llashni yana bir avlod oldinga siljishini kuzatmoqdamiz.
2013-yilda 5 yil va tadqiqot guruhi ketgan AI vazifalarining ko‘pi 2023-yilda faqatgina kechqurun ozroq bo‘sh vaqt va API dokumentatsiyalarini o‘qishni talab etyapti.

“Kelajakda AI muhandislari ML/LLM muhandislariga qaraganda ancha ko‘p bo‘lishi mumkin. Hech qanday modellarni o‘rgatmasdan turib, bu kasbda muvaffaqiyat qozonsa bo‘ladi." - Andrey Karpati
Biroq, AI’ni muvaffaqiyatli baholash, qo‘llash va mahsulot qurish qiyinchiliklari tugamaydi:
Modellar: eng katta GPT-4 va Claude modellaridan tortib, eng kichik ochiq manbali Huggingface, LLaMA va boshqa modellarigacha baholash.
Asboblar: LangChain, LlamaIndex va Pinecone kabi eng mashhur zanjirlash (chaining), retrieval va vektorli qidiruv vositalaridan Auto-GPT va BabyAGI kabi avtonom agentlarning rivojlanayotgan sohasigacha (o‘qilishi kerak bo‘lgan Lilian Vengning maqolasi)
Yangiliklar: Bundan tashqari, qiziqish va mablag‘ bilan eksponensial ravishda o‘sib borayotgan kunlik maqolalar, modellar va texnikalarning ko‘pligidan ularning hammasini kuzatib borish deyarli to‘liq ish vaqtini olib qo‘yadi.
Men buni jiddiy va tom ma’noda qabul qilaman. Menimcha, bu to‘liq ish vaqtini oladi. O‘ylaymanki, software muhandisligi rivojlanishi ortidan "sayt ishonchliligi muhandisi", "devops muhandisi", "ma’lumotlar muhandisi" va "tahlil muhandisi" paydo bo‘lganidek, sun’iy intellektni qo‘llashga ixtisoslashgan va paydo bo‘layotgan vositalarni samarali ishlatadigan yangi soha paydo bo‘ladi.
Ushbu kasbning yangi paydo bo‘lgan (va ma’niliroq)1 nomi: AI muhandisi.
Men bilgan har bir startapda qandaydir #discuss-ai
nomli Slack kanali bor. Bu kanallar Amplitude, Replit va Notion kompaniyalarida norasmiy guruhlardan rasmiy jamoalarga aylanadi. Minglab xoh tunda va dam olish kunlarida, xoh korporativ Slacks yoki Discord’larda API yoki ochiq manbali (Open Source yoki OSS) modellar ustida mahsulot qurayotgan dasturiy ta’minot muhandislari professional bo‘lib, AI muhandisi unvoniga ega bo‘ladilar. Bu, ehtimol, keyingi o‘n yillikdagi eng yuqori talabga ega muhandislik ishi bo‘ladi.
AI muhandislarini Microsoft va Google kabi eng yirik kompaniyalardan tortib, Figma (Diagram startapini sotib olish orqali), Vercel (masalan, Hassan El Mgharining mashhur RoomGPT) va Notion (masalan, Ivan Chjao va Simon Lastlarning Notion AI) kabi yetakchi startaplar, Simon Uillison, Pieter Levels (Photo/InteriorAI) va Riley Goodside (hozirda Scale AIda) kabi mustaqil xakerlar orasidan topishingiz mumkin. Ular Anthropic’da prompt muhandisligi uchun yiliga 300 ming dollar va OpenAI’da dasturiy ta’minot ishlab chiqarish uchun yillik 900 ming dollar olishmoqda. Ular dam olish kunlarini AGI House’da g‘oyalarni almashish va /r/LocalLLaMA2 bo‘yicha maslahatlar berish o‘tkazishmoqda. Ularning umumiy tomoni shundaki, ular sun’iy intellekt yutuqlarini deyarli bir kechada millionlab odamlar foydalanadigan haqiqiy mahsulotlarga aylantirmoqdalar.
Birorta ham PhD ular orasida yo‘q. AI mahsulotlarini qurish haqida gap ketganda, sizga ko‘proq tadqiqotchilar emas, muhandislar kerak.
AI va ML muhandislarining o‘girilishi
Men yangi trendni boshlashdan ko‘ra unga e’tibor qaratyapman. Haqiqatan ham, Indeed’da AI muhandisi ish o‘rinlaridan ko‘ra 10 barobar ko‘p ML muhandislik ishlari mavjud, ammo "AI" ning yuqori o‘sish sur’atlari meni bu nisbat 5 yil ichida teskarisiga o‘zgarishini taxmin qilishimga olib keladi.
Barcha lavozim nomlari nuqsonga ega, ammo ba’zilari foydali. Biz AI va ML o‘rtasidagi farq bo‘yicha cheksiz bahslardan charchaymiz/ehtiyot bo‘lamiz va "software muhandisi"lari AI dasturiy ta’minotini yaratishga qodir ekanligini yaxshi bilamiz. Biroq, yaqinda HN’ning AI muhandisligiga qanday kirish mumkinligi haqidagi savoli bozorda hali ham saqlanib qolgan asosiy tushunchani ko‘rsatadi:

Aksariyat odamlar hali ham AI muhandisligini ML yoki ma’lumotlar muhandisligining bir shakli deb bilishadi, shuning uchun ular bir xil shartlarni tavsiya qiladilar. Lekin men sizga kafolat beramanki, men yuqorida nomlagan yuqori samarali AI muhandislarining hech biri Andryu Ngning Coursera kurslariga teng ishlarni bajarmagan, ular PyTorch yoki Data Lake yoki Data Warehouse o‘rtasidagi farqni bilishmaydi.3
Yaqin kelajakda hech kim AI muhandisligini boshlashda "Attension is all you need" (Sizga faqat e’tibor kerak) maqolasini o‘qishni tavsiya etmaydi, xuddi Ford T Modelini uning sxemalarini o‘qib haydashni boshlamagandek. Albatta, tarix va fundamental bilimlarni bilish hali ko‘pchilik payqamagan yangi g‘oyalarni topishda yordam beradi. Ammo ba’zida siz shunchaki mahsulotlarning qobiliyatlarini ulardan foydalanish orqali tajriba qilib o‘rganishingiz mumkin.
Men o‘quv dasturining bu "o‘zgarishi" bir kechada sodir bo‘lishini kutmayman. Rezyumeni to‘ldirish, bozor talablariga moslashish va chuqurroq mavzularni ko‘proq ma’lumotga ega bo‘lish orqali ajralib turishni xohlash inson tabiatidir. Boshqacha qilib aytganda, Prompt muhandislari va AI muhandislari uzoq vaqt davomida yaxshi Data Science/ML ma’lumotlariga ega bo‘lgan odamlardan pastroq bo‘lib qoladi. Biroq, menimcha, talab va taklif iqtisodiyoti o‘zini namoyon qiladi.
Nima uchun AI muhandislari hozir paydo bo‘lmoqda
Poydevor modellari "bir nechta misoldan o‘rganuvchilar" (few shot learners) bo‘lib, ular kontekstda o‘rganishni va hatto model o‘qitilayotganda ko‘zlangan asl qobiliyatlardan tashqari yangi qobiliyatlarni namoyish etyapti. Boshqacha qilib aytganda, modellarni o‘qitayotgan odamlar ham ular nimaga qodirligini to‘liq bilishmaydi. LLM tadqiqotchisi bo‘lmagan odamlar modellar bilan ko‘proq vaqt o‘tkazish va ularni tadqiqot tomonidan baholanmagan sohaga qo‘llash orqali (masalan, Jasper kopirayterlik bilan) qobiliyatlarni topishi va ulardan foydalanishi mumkin.
Microsoft, Google, Meta va katta Foundation Model laboratoriyalari “xizmat sifatida AI tadqiqoti” API’larini taqdim etish uchun yetarlicha tadqiqotchilarni topa olmayapti. Siz ularni yollay olmaysiz, agar boshqa tomonda ular bilan qanday ishlashni biladigan dasturiy ta’minot muhandislari bo‘lsa ularni ijaraga olishingiz mumkin. Dunyoda 5000 ta atrofida LLM tadqiqotchilari bor, lekin dasturiy ta’minot muhandislari 50 millionga yaqin. Ta’minot cheklovlari talabni qondirish uchun AI muhandislarining "oradagi" tushurishini talab qiladi.
GPU yig‘ish. Albatta, OpenAI/Microsoft birinchi edi, lekin Stability AI ham 4000 GPU klasterini yig‘ib4, GPU qurollanish poygasiga kirdi.
O‘shandan beri Inflection (1,3 milliard dollar), Mistral (113 million dollar), Reka (58 million dollar), Poolside (26 million dollar) va Contextual (20 million dollar) kabi yangi startaplar o‘zlarining shaxsiy klasterlariga ega bo‘lishlari uchun katta mablag‘larni jalb qilish odatiy holga aylandi. Hatto Den Gross va Nat Friedman5 ham Andromeda (100 million dollarlik) 10 eksaflop GPU klasterini faqat ular sarmoya kiritgan startaplar uchun e’lon qildi. Global chip yetishmovchiligi6 refleksli ravishda yanada ko‘proq tanqislikni keltirib chiqarmoqda. API liniyasining boshqa tomonida AI muhandislari uchun modellarni o‘rgatish o‘rniga ulardan foydalanish imkoniyati ancha ko‘p bo‘ladi.
G‘oya, mahsulot, maqsad. Data Scientist/ML muhandislari biror vazifa bajaradigan modelni o‘rgatishdan oldin mashaqqatli ma’lumot to‘plashni talab qilish o‘rniga, loyiha menejeri/software muhandisi aniq ma’lumot olishdan oldin LLM’larni prompt qilishi va mahsulot g‘oyasini yaratishi/tasdiqlashi mumkin.
Aytaylik, keyingisi avvalgisidan 100-1000 baravar ko‘p va taklif qilingan LLM prototiplarining "g‘oya, mahsulot, maqsad" ish jarayoni an’anaviy ML’ga qaraganda 10-100 baravar tezroq harakat qilish imkonini beradi. Shunday qilib, AI muhandislari AI mahsulotlarini 1000-10 000 marta arzonroq tekshirishlari mumkin. Bu yana bir bor Waterfall va Agile bahsi. AI bu Agile.
Python + JavaScript. Ma’lumotlar/AI an’anaviy ravishda Python’ga o‘ta markazlashgan va LangChain, LlamaIndex va Guardrails kabi birinchi AI muhandislik vositalari xuddi shu jamoadan paydo bo‘lgan. Biroq, dunyoda Python daftarchilarichalik JavaScript dasturchilari ham bor, shuning uchun endi LangChain.js va Transformers.js dan Vercelning yangi AI SDK’ga qadar kengaygan asboblar auditoriyaga tobora ko‘proq xizmat qilmoqda. TAM kengayishi va imkoniyatlari kamida 100% kattaroqdir.
Generativ AI va ML klassifikatori. "General AI"7 atama sifatida o‘z o‘rnini "mulohaza yuritish mexanizmi" kabi boshqa analogiyalarga bo‘shatib qo‘ydi, ammo MLOps vositalarining mavjud guruhi va ML amaliyotchilari o‘rtasidagi farqni qisqacha ifodalashda foydalidir. Mavjud ML avlodi firibgarlikni aniqlash, tavsiyalar tizimlari, anomaliyalarni aniqlash va xususiyatlarni saqlashga oid vazifalarni hal qilishga o‘rgangan, AI muhandislari yozish ilovalari, moslashtirilgan o‘rganish vositalari, tabiiy tillar jadvallari va Factorio‘ga o‘xshash vizual dasturlash tillarini yaratmoqdalar.8
Qachonki, umuman boshqa ma’lumotga ega bo‘lgan, boshqa tilda gapiradigan, butunlay boshqa mahsulotlar to‘plamini ishlab chiqaradigan va butunlay boshqa vositalar to‘plamidan foydalanadigan kichik guruh paydo bo‘lganda, ular oxir-oqibat o‘z guruhlariga bo‘linadi.
1+2=3: Software 2.0 dan Software 3.0 ga evolyutsiyada kodning o‘rni
6 yil oldin Andrey Karpati Software 2.0’ni tavsiflovchi juda ta’sirli maqola yozgan - bu qo‘lda kodlangan dasturlash tillarining "klassik to‘plami" ni mantiqqa yaqinlashtiruvchi "mashinada o‘rganilgan" neyron tarmoqlarning yangi to‘plamiga nisbatan aniq modellashtirib, inson tomonidan modellashtirilishi mumkin bo‘lganidan ko‘ra ko‘proq muammolarni hal qilish imkonini beradi. U bu yil eng qizg‘in yangi dasturlash tili ingliz tili ekanligini ta’kidlab, nihoyat o‘z diagrammasidagi asl inshoda yorliqsiz qoldirilgan kulrang maydonni to‘ldirdi.
Yangilash: Karpati javob berdi! Biroz kelishmovchilik bilan!
O‘tgan yili odamlar GPT-3 va Stable Diffusion’dan foydalanishni boshlaganlarida, Prompt muhandisligini ish o‘rinlari qanday o‘zgarishi haqida mem sifatida ko‘rilardi. Odamlar sun’iy intellekt startaplarini "OpenAI Wrappers" deb masxara qilishar va LLM ilovalarini prompt inyeksiya (prompt injection) va teskari prompt’larga moyil bo‘lganidan xafa bo‘lishardi. Hech qanday yechim topilmadimi?
Ammo 2023-yilning eng katta mavzularidan biri LLM qobiliyatlarini yuzaga chiqarish uchun inson tomonidan yozilgan kodning rolini qayta tiklash haqida bo‘ldi, 200 million dollarlik gigant Langchain’dan Nvidia’dan Voyager’gacha kod yaratishning shubhasiz ahamiyatini ko‘rsatadi (men yaqinda Harrison bilan Chains vs Agents veb-seminarida Code Core va LLM Core ilovalari tezisini kengaytirdik).

Prompt muhandisligi ham haddan tashqari shov-shuvlarga sabab bo‘lgan, ammo kerakli soha, lekin Software 3.0 ilovalarida Software 1.0 paradigmalarining qayta paydo bo‘lishi ham ommaviy imkoniyatlar/chalkashlik olib kelib, bir qatorda startaplar uchun imkoniyatlar yaratdi:
Albatta, bu shunchaki inson tomonidan yozilgan kod bo‘lmaydi. Mening so‘nggi sarguzashtlarimdan smol-developer, keng qamrovli gpt-engineer va Codium AI, Codegen.ai va Morph/Rift kabi boshqa kod ishlab chiqarish agentlari bilan tobora ko‘proq AI Engineer asboblar to‘plamining bir qismi bo‘ladi. Muhandislar sun’iy intellektdan foydalanishni o‘rganar ekan, AI ham muhandislik bilan shug‘ullanishni davom ettiradi, toki bir kuni kelib AI va insonlar o‘rtasidagi farqni aytolmay qolamiz.
Birlashish vaqti keldi - AI Engineer Summit
Quruvchilarga turpentin haqida gaplashadigan joy kerak. Shu sababli, bir necha oylik kichik uchrashuvlarni tashkil qilganimizdan so‘ng, biz endi birinchi mustaqil ravishda, muhandislarga yo‘naltirilgan AI konferensiyasini e’lon qilamiz: AI Engineer Summit!

Agar ushbu postdagi fikrlar sizning fikrlaringizga mos tushsa, biz barcha eng yaxshi AI muhandislari, asoschilari va investorlarini bir joyga to‘plashni maqsad qilib qo‘ymoqchimiz. Bu ularga eng zamonaviy texnologiyalarni o‘rganish, seminarlarda qatnashish/o‘rgatish va ular foydalanadigan ajoyib yangi vositadan tortib keyingi yangi ishchi/sherik/sarmoya topishga yordam beradi.
Ushbu konferensiyada o‘tgan yillardagi maqola, podkast va boshqalarda muhokama qilgan barcha mavzularni qaytadan muhokama qilish uchun ajoyib imkoniyat:
AI UX
AI asboblari (devtools)
AI infrastrukturasi
AI agentlari
Yangi LLM asboblari, jumladan Langchain, vektor ma’lumotlar bazasi va boshqalar
Ochiq manbali modellari (o‘qitish, fine-tuning, ishlatish, baholash)
Men hamjamiyatni boshqarishda yaxshi tajribaga egaman, lekin hech qachon 500 kishilik konferensiya o‘tkazmaganman, shuning uchun men San-Fransiskoda eng yaxshi AI muhandisi konferensiyasini o‘tkazish uchun Reactathon’dan Ben Danfi bilan hamkorlik qilyapman (va onlayn - uning so‘nggi konferensiyasi 20 000+ kishi masofadan kuzatgan).
ai.engineer’da bizga qo‘shiling!
Biz ma’ruzachi va homiylarni qabul qilyapmiz (aloqa chiqing!).
Biz yasovchilarmiz
Ziyrak kuzatuvchilarimiz biz asta-sekin Latent Space podkasti va maqolalarimiz AI muhandisi shaxsiyatiga moslashayotganimizni payqashdi. Ushbu auditoriyaga xizmat ko‘rsatishda meni ruhlantiradigan narsa bu texno-optimizm va amaliyot uyg‘unligidir. Mark Andreesen yaqinda ommaviy sun’iy intellektning aksariyat qismi "vahimali qo‘rquv va paranoya" bo‘lganligi va "AI xavfsizligi bo‘yicha mutaxassis", "AI axloqshunosi" (ethicist), "AI xavfini o‘rganuvchi" kabilar doomerlarga aylanib, lekin yasovchi (developer) va foomerlar uchun tegishli roli yo‘q degandi. Spektrning boshqa tomonida ko‘plab jiddiy bo‘lmagan akseleratsiyachalar va chidab bo‘lmas foomer yozuvchilar bor, ular butun kunni Twitter’da uzoq utopik kelajak haqida yozish bilan o‘tkazib, buni amalga oshirish uchun nima qilayotganlari noma’lum.
AI muhandislari Shoggoth’ni qo‘lga o‘rgatib, minib yurishadi.
Keling, buni bajaraylik.
Ko‘proq muhokamalar Hacker News va Twitter’da.
Muallifning eslatmasi: Men sherigim Decibel’dan Alessio Fanelli va Conviction’dan Sara Guo va Pranav Reddiga ushbu maqolaning qoralamalarini ko‘rib chiqqani va tanqidiy fikr-mulohazalari va bebaho yordami uchun alohida minnatdorchilik bildiraman. Va, albatta, Ben Danfiga AI muhandis konferensiya seriyasi va tarmog‘ini yaratishga roziligi uchun tashakkur. Hammaga rahmat!
Tarjimon eslatmasi: bu maqola tarjima qilinayotgan vaqtda AI Engineer Summit allaqachon o‘tib ketgan bo‘lsada, ai.engineer sahifasida video va slaydlarni topa olasiz.
Muqobil variantlar sifatida "Poydevor modellari muhandisi", "AI API muhandisi", "LLM muhandisi" ko‘rib chiqildi, lekin ular umuman tilga o‘tirmadi, "Prompt muhandisi" esa biz ko‘rib turgan Code Core, LLM Shell uchun juda cheklangan. "MLOps muhandisi" ham bor, ammo bu avvaldan quyi darajadagi ML muammolariga yo‘naltirilgan va yaxshi tashkil etilgan hamjamiyatdir - biz bu farqni keyinroq muhokama qilamiz. Nihoyat, "AI Tinkerer" Aleks Graveli ((bahsli?) Copilot yaratuvchisi) tomonidan ommalashtirilgan, ammo afsuski, bu unvonga ko‘pchilik loyiq emas.
Menga yoqqan AI podkastlari, maqolalari va hamjamiyatlarining to‘liq ro‘yxati GitHub’da saqlanadi.
Va, ehtimol, transformerlarni doskada tushuntira olmaydi.
Stability va AWS’ning klasteri orasidagi munosabatlari munozarali, shuning uchun bu borada Emadning o‘z so‘zlarini eshitish yaxshiroq.
Men ular uchun nomeronimlar ishlab chiqyapman. g12n?
Aniqroq aytganda, bu Nvidia chipining yetishmasligi. Shuning uchun Jorj Hotzning Tinycorp mashhur ochiq kodli modellarni AMD kartalarida ishga tushirishi juda muhimdir. Mosaic’ning LLMFoundry ham AMD chiplarini ishlata olishi ham ajoyib yangilik.
Va albatta, "Gen AI".
Albatta, siz ikkala sohani ham yaxshi birlashtira olasiz. Natijada Transformerlar maqolasining hammuallifi tomonidan asos solingan Character.ai da LLM’lar uchun foydali jihatini kashf qilish kabi ajoyib natijalarga ega bo‘lasiz.