Galaxy -ll Crash kursuna saldıran Galaxy -ll Bölüm 4

semaver

New member


  1. Galaxy -ll Crash kursuna saldıran Galaxy -ll Bölüm 4

İnsan dili işlemek ve üretmek için büyük bir dilsel model (LLM) tasarlanmıştır. Birincisinde LLM'nin temel tanıtımından sonra, ikincisinde donanım gereksinimleri ve önceden düzenlenmiş modeller ve üçüncü bölümde mimari türleri, zamanın sonu.








Dr. Michael Stal, 1991 yılından bu yana Siemens teknolojisi üzerinde çalışmaktadır. Yazılım mimarisi sorunları hakkında iş alanları önermektedir ve Siemens'in kıdemli yazılım mimarlarının mimari oluşumundan sorumludur.








Emniyet kemerlerini oruçlamak!

Bir düşünce olarak öğrenilen


Deepseek R1 veya Openai O3 gibi modern LLM'leri kullanan herkes genellikle “düşünce” veya “akıl yürütme” gibi masrafları görmelidir. Bu nedenle dilsel model yapılandırılmış ve sistematik olarak bir soruşturmaya tepki verebilir. Bu nedenle, akıl yürütme modelleri çağrılır.

Büyük modellerdeki argümanlar veya sonuçlar, yönetilebilir fazlardaki karmaşık sorunları sökme ve mantıklı açıklamalar sağlama yeteneklerini geliştiren çeşitli tekniklerle uygulanmaktadır. En önemli yöntemler şunları içerir:

  • Her ne kadar chene olsa da (COT) LLMS eğitimini içerir, böylece cevaplarınız için yavaş yavaş açıklamalar üretir, bu da insanlara benzer denemeleri taklit etmenize yardımcı olur.
  • Denetimli son ayarlama (SFT) ve takviye öğrenimi: Yıldız (otomatik struser nedeni) gibi teknikler, modelleri doğru argümanların üretimi için ödüllendirmek için takviye öğrenimi kullanır, bu nedenle SFT için kullanılabilir.
  • Hızlı Mühendislik: Aktif hızlı ve düşünce zinciri gibi stratejiler, LLM'nin LLM'yi yavaş yavaş “düşünebilmesi” için yapılandırarak LLM'nin argümanını teşvik etmek için kullanır.


Bu yöntemler, LLM'lerin şeffaf düşünce süreçlerini tartışma ve sağlama yeteneğini geliştirmeyi amaçlamaktadır, ancak uzmanlar gerçekten destekledikleri alanı tartışmaya devam etmektedir.

Uzatma Zinciri (COT), büyük dil modellerinin argümanlarını, bir dizi mantıksal pasajda karmaşık görevleri sökmeye teşvik ederek geliştirir. Bu yaklaşım insan düşüncesini yansıtır ve modellerin daha sistematik ve şeffaf sorunlarla karşılaşmasına izin verir. En önemli avantajlar şunları içerir:

  • Geliştirilmiş doğruluk: Bir adım birbiri ardına konsantrasyon nedeniyle, LLM'ler, özellikle sorunların matematiksel çözümü ve mantıksal düşünme gibi karmaşık görevler için daha kesin sonuçlar sağlayabilir.
  • Geliştirilmiş Açıklanabilirlik: COT talimatları, modelin yapay zeka baskılarının güvenini ve anlayışını geliştiren sonuçlarına ulaşma şeklinin net bir vizyonu sunar.
  • Azaltılmış Çözümler: Modeli yapılandırılmış argüman pasajları ile yönlendiren Karyolası önerisi, LLM yanıtlarındaki hataların ve halüsinasyonların azaltılmasına yardımcı olur.
Sonuç: LLM'nin geleceği


Büyük vokal modeller, doğal dilin detaylandırılması alanında devrim yarattı ve dilin çevirisi, metin ve sohbet botları ile ilgili metin gibi uygulamaları etkinleştirdi. LLM'nin geleceği, eğitim, sağlık ve eğlence gibi sektörlerde olası uygulamalarla heyecan vericidir.

Yenilikçi bir çözüm, MOE prosedürlerinin tanıtımıdır (Moe = uzmanların karışımı) llms. Bu modeller, her biri belirli bir alanda uzmanlaşmış LLM bileşenlerinden oluşur. Bir geçit mekanizması yoluyla, model kullanıcının isteklerini uygun LLM bileşenine iletir.

Altında Ajan Örneğin, işlevleri başlatmak veya kullanıcı arayüzünü yönetmek için çevreleyen ortama erişebilen LLM ajanlarını anladıkları anlaşılmalıdır.

Çok ajan sistemleri Daha önce bahsedilen uzmanların karışımını hatırlayan ortak bir görevi çözmek için farklı rolleri olan ve birlikte hareket eden birkaç LLM ajanı içerirler.

Bu arada, metne ek olarak görüntüler, videolar, ses veya semboller de anlayabilir ve/veya oluşturabilir. Görüntüleme modelleri, daha sonra görüntü hakkında sorular sormak için bir resim sunulabilir. Bazı modeller metin yerine belirgin bir dil eklemenize izin verir. Openaai Sora gibi modeller dilsel talimatlardan gerçekçi videolar oluşturur. Midjourney, ve benzer modeller kullanıcının gereksinimlerinden (istemi) görüntüler oluşturabilir. Modellerin mimarisi bu makalede sunulan mimariye çok benzer. Modeller, piksel segmentleri ve metin jetonları gibi diğer öğeleri de işleyebilir ve üretebilir.

Bu hızlı gelişme ışığında, LLM temasını ve bir geliştirici olarak üretken yapay zekayı yoğun bir şekilde ele almak önemlidir. Yeni LLM teknolojilerini, özellikle yaşamımız ve toplumumuz üzerindeki etkiler açısından eleştirel olarak sorgulamak da aynı derecede önemli olmalıdır. Bu özellikle ilkeler ve etik değerler için geçerlidir. Sadece teknolojileri bilen ve anlayanlar fırsatları ve riskleri değerlendirebilir ve değerlendirebilir.

Ek Kaynaklar


LLM hakkında daha fazla bilgi edinmek isteyenler için burada bazı ek kaynaklar var:

sözlük


İşte bu makale dizisinde kullanılan bazı terimlerin bir sözlüğü:

  • LLM: Büyük Dilbilimsel Model
  • Tokenizer: Giriş metnini jeton adı verilen daha küçük birimlerde caydıran bir bileşen.
  • Kuruluş: Sayısal anlamı yakalayan -parole veya işaretler, kelimelerin sayısal gösterimleri.
  • Kodlayıcı: Giriş metninin sürekli bir gösterimini oluşturan bir bileşen.
  • Kod çözücü: Girişe ve bağlamsal sunuma göre metin üreten bir bileşen.
  • Kendi Post: Modelin giriş metninin farklı bölümlerine dikkat etmesini ve bağlamsallaştırılmış bir ekran oluşturmasını sağlayan bir mekanizma.
  • Çapraz yazı: Modelin harici bilgilere dikkat etmesini sağlayan bir mekanizma, ör. B. Giriş metni veya diğer modeller.
  • Önceden eğitilmiş modeller: Yaratıcılarını büyük veri kayıtları konusunda eğiten ve belirli etkinlikler için mükemmelleştirilen modeller.
  • Bağlam penceresi: Modelin belirli bir anda inceleyebileceği giriş metni miktarı.
  • Maskeler: Modelin giriş metninin belirli bölümlerine dikkat etmesini engelleyen mekanizmalar.

(RME)
 
Üst