هنا يأتي FastVLM



يضعون MLP لإسقاط الرموز المرئية من FastViTHD إلى عالم LLM.

النتيجة: عدد أقل بكثير من الرموز ( مثل 4× أقل من FastViT، 16× أقل من ViT‑L/14 بدقة 336 بكسل ). أعني، هذا انخفاض كبير في عدد الرموز والتعقيد، بينما
IN4.97%
MLP7.4%
PIXEL3.27%
TOKEN2.77%
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 6
  • إعادة النشر
  • مشاركة
تعليق
0/400
rekt_but_resilientvip
· منذ 2 س
هنا التحسين هائل!
شاهد النسخة الأصليةرد0
GasFeeLovervip
· 09-02 14:39
حسناً، لا يوجد ما يُفاخر به.
شاهد النسخة الأصليةرد0
ser_we_are_earlyvip
· 09-02 14:39
يبدو أن FastVLM رائع حقًا
شاهد النسخة الأصليةرد0
BlockchainBardvip
· 09-02 14:38
مذهل! لقد اندهشت من عدد الرموز.
شاهد النسخة الأصليةرد0
WhaleWatchervip
· 09-02 14:27
لقد أضفت شيئًا جديدًا مرة أخرى!
شاهد النسخة الأصليةرد0
DiamondHandsvip
· 09-02 14:23
آه آه، أشعر بالدوار بسبب الرياح...
شاهد النسخة الأصليةرد0
  • تثبيت