El 21 de mayo, un proveedor de servicios en la nube redujo drásticamente el precio de llamada a su API de modelos de lenguaje a gran escala. Entre ellos, el precio de entrada del modelo principal cayó de 0.02 yuanes/ mil tokens a 0.5 yuanes/ millón de tokens, con una reducción de hasta el 97%.
Recientemente, la empresa lanzó un modelo de lenguaje grande de código abierto con una escala de parámetros de 110 mil millones. Según se informa, este modelo superó el rendimiento de modelos similares de 70 mil millones de parámetros en varias pruebas de referencia, y ocupó el primer lugar en una lista de clasificación de modelos de código abierto.
La combinación de estrategias de "reducción de precios + código abierto" se está convirtiendo en un consenso entre los fabricantes de grandes modelos en todo el mundo. Esto ayuda a abordar dos grandes problemas que enfrentan los desarrolladores de aplicaciones de IA: el alto costo de las API y la calidad insuficiente de los modelos de código abierto, lo que a su vez impulsa la amplia implementación de aplicaciones de IA.
Desde mayo, varias empresas de modelos grandes han lanzado productos de bajo costo o han reducido precios. Esto incluye un modelo MoE de código abierto de una empresa de cuantificación, cuyo precio es solo el uno por ciento de un modelo conocido; una empresa de IA ha reducido el precio de la versión personal del modelo en un 80%; una empresa internacional de IA ha lanzado una nueva versión con un rendimiento comparable pero a la mitad de precio; varias empresas nacionales también han anunciado que sus modelos serán gratuitos de por vida o que bajarán drásticamente de precio. Esta ola de reducción de precios podría deberse a los avances en tecnología de inferencia y la disminución de costos, lo que objetivamente ofrece más opciones a los desarrolladores.
Además de la estrategia de precios, la diversificación de modelos también es una gran tendencia. Recientemente, algunas empresas han lanzado ocho grandes modelos de lenguaje con parámetros que varían de 500 millones a 1100 millones, para adaptarse a diferentes necesidades de escenarios. Modelos más pequeños como 0.5B-14B son adecuados para ser implementados en dispositivos móviles, mientras que modelos más grandes como 72B-110B apoyan aplicaciones a nivel empresarial, y el modelo de 32B busca un equilibrio entre rendimiento y eficiencia. Además, se han abierto modelos especializados para visión, audio, código, entre otros. Estas iniciativas ayudan a que los grandes modelos se implementen en una gama más amplia de escenarios.
Los inversores pueden prestar atención a los siguientes sectores:
Relacionado con la potencia de cálculo: incluye empresas en subsectores como comunicación óptica, programación de potencia de cálculo, equipos de potencia de cálculo, refrigeración líquida, entre otros.
Elementos de datos: principalmente operadores de telecomunicaciones y empresas de visualización de datos
Computación en el borde: como empresas relacionadas con plataformas de capacidad de computación en el borde
Los riesgos a tener en cuenta incluyen que el progreso de la comercialización de los grandes modelos y el desarrollo tecnológico no cumplan con las expectativas. La implementación de aplicaciones de grandes modelos aún requiere tiempo, y los inversores deben mantener una actitud racional.
Comentario de la industria
La drástica reducción de precios de los modelos de lenguaje grandes refleja que la industria está entrando en una nueva etapa. Al reducir la barrera de entrada, las principales empresas esperan atraer a más desarrolladores para acelerar la implementación de aplicaciones de IA. Al mismo tiempo, la difusión de estrategias de código abierto también beneficia el desarrollo saludable de todo el ecosistema.
Sin embargo, la guerra de precios no es una solución a largo plazo. En el futuro, la calidad del modelo y las características especiales se convertirán en los puntos clave de competencia. Hemos visto que, además de los grandes modelos generales, también han comenzado a surgir modelos especializados optimizados para campos específicos. Esto indica que la industria está avanzando hacia una dirección más segmentada y especializada.
Para los inversores, las empresas relacionadas con hardware e infraestructura podrían beneficiarse del aumento de la demanda de capacidad de cómputo a corto plazo. Sin embargo, a largo plazo, las empresas que pueden ofrecer soluciones en sectores verticales específicos pueden tener un mayor valor de inversión. Al mismo tiempo, la tecnología relacionada con la seguridad de los datos y la protección de la privacidad también merece atención.
En general, la industria de los grandes modelos se encuentra en un período de rápida transformación. La competencia de precios es solo el comienzo; la competencia futura se centrará más en la innovación tecnológica, la expansión de escenarios de aplicación y la innovación en modelos de negocio. Los inversores deben mantenerse alerta y prestar atención a las dinámicas de la industria y a los cambios en las políticas.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
7 me gusta
Recompensa
7
6
Compartir
Comentar
0/400
CryptoSurvivor
· hace22h
¿Otro jugador que baja precios? No entiendo quién podrá sobrevivir.
Ver originalesResponder0
SleepyValidator
· 07-19 01:55
precio bajo precio
Ver originalesResponder0
TopBuyerBottomSeller
· 07-19 01:55
Bajó tanto, ¿cómo es que no introduje una posición?
Ver originalesResponder0
UncleWhale
· 07-19 01:52
caída tan fuerte, grandes inversores ya prepararon una emboscada, ¿verdad?
Ver originalesResponder0
SigmaBrain
· 07-19 01:49
¿Bajar a este precio? ¿Esto es para competir entre nosotros?
La ola de reducciones de precios de los grandes modelos llega, el panorama de la industria se transforma.
Observación de la industria
El 21 de mayo, un proveedor de servicios en la nube redujo drásticamente el precio de llamada a su API de modelos de lenguaje a gran escala. Entre ellos, el precio de entrada del modelo principal cayó de 0.02 yuanes/ mil tokens a 0.5 yuanes/ millón de tokens, con una reducción de hasta el 97%.
Recientemente, la empresa lanzó un modelo de lenguaje grande de código abierto con una escala de parámetros de 110 mil millones. Según se informa, este modelo superó el rendimiento de modelos similares de 70 mil millones de parámetros en varias pruebas de referencia, y ocupó el primer lugar en una lista de clasificación de modelos de código abierto.
La combinación de estrategias de "reducción de precios + código abierto" se está convirtiendo en un consenso entre los fabricantes de grandes modelos en todo el mundo. Esto ayuda a abordar dos grandes problemas que enfrentan los desarrolladores de aplicaciones de IA: el alto costo de las API y la calidad insuficiente de los modelos de código abierto, lo que a su vez impulsa la amplia implementación de aplicaciones de IA.
Desde mayo, varias empresas de modelos grandes han lanzado productos de bajo costo o han reducido precios. Esto incluye un modelo MoE de código abierto de una empresa de cuantificación, cuyo precio es solo el uno por ciento de un modelo conocido; una empresa de IA ha reducido el precio de la versión personal del modelo en un 80%; una empresa internacional de IA ha lanzado una nueva versión con un rendimiento comparable pero a la mitad de precio; varias empresas nacionales también han anunciado que sus modelos serán gratuitos de por vida o que bajarán drásticamente de precio. Esta ola de reducción de precios podría deberse a los avances en tecnología de inferencia y la disminución de costos, lo que objetivamente ofrece más opciones a los desarrolladores.
Además de la estrategia de precios, la diversificación de modelos también es una gran tendencia. Recientemente, algunas empresas han lanzado ocho grandes modelos de lenguaje con parámetros que varían de 500 millones a 1100 millones, para adaptarse a diferentes necesidades de escenarios. Modelos más pequeños como 0.5B-14B son adecuados para ser implementados en dispositivos móviles, mientras que modelos más grandes como 72B-110B apoyan aplicaciones a nivel empresarial, y el modelo de 32B busca un equilibrio entre rendimiento y eficiencia. Además, se han abierto modelos especializados para visión, audio, código, entre otros. Estas iniciativas ayudan a que los grandes modelos se implementen en una gama más amplia de escenarios.
Los inversores pueden prestar atención a los siguientes sectores:
Relacionado con la potencia de cálculo: incluye empresas en subsectores como comunicación óptica, programación de potencia de cálculo, equipos de potencia de cálculo, refrigeración líquida, entre otros.
Elementos de datos: principalmente operadores de telecomunicaciones y empresas de visualización de datos
Computación en el borde: como empresas relacionadas con plataformas de capacidad de computación en el borde
Los riesgos a tener en cuenta incluyen que el progreso de la comercialización de los grandes modelos y el desarrollo tecnológico no cumplan con las expectativas. La implementación de aplicaciones de grandes modelos aún requiere tiempo, y los inversores deben mantener una actitud racional.
Comentario de la industria
La drástica reducción de precios de los modelos de lenguaje grandes refleja que la industria está entrando en una nueva etapa. Al reducir la barrera de entrada, las principales empresas esperan atraer a más desarrolladores para acelerar la implementación de aplicaciones de IA. Al mismo tiempo, la difusión de estrategias de código abierto también beneficia el desarrollo saludable de todo el ecosistema.
Sin embargo, la guerra de precios no es una solución a largo plazo. En el futuro, la calidad del modelo y las características especiales se convertirán en los puntos clave de competencia. Hemos visto que, además de los grandes modelos generales, también han comenzado a surgir modelos especializados optimizados para campos específicos. Esto indica que la industria está avanzando hacia una dirección más segmentada y especializada.
Para los inversores, las empresas relacionadas con hardware e infraestructura podrían beneficiarse del aumento de la demanda de capacidad de cómputo a corto plazo. Sin embargo, a largo plazo, las empresas que pueden ofrecer soluciones en sectores verticales específicos pueden tener un mayor valor de inversión. Al mismo tiempo, la tecnología relacionada con la seguridad de los datos y la protección de la privacidad también merece atención.
En general, la industria de los grandes modelos se encuentra en un período de rápida transformación. La competencia de precios es solo el comienzo; la competencia futura se centrará más en la innovación tecnológica, la expansión de escenarios de aplicación y la innovación en modelos de negocio. Los inversores deben mantenerse alerta y prestar atención a las dinámicas de la industria y a los cambios en las políticas.