Microsoft presentó su modelo más reciente de IA de tamaño medio en su intento por afianzarse en la tecnología, pero su director ejecutivo, Mustafa Suleyman, dijo que el gigante de tecnología aún carece de la potencia computacional necesaria para desarrollar sistemas de vanguardia.
El jueves, el gigante del software lanzó un modelo de transcripción de voz que Suleyman calificó como el más avanzado de su tipo, intensificando así sus esfuerzos para alcanzar a sus rivales y reducir su dependencia de OpenAI.
Microsoft todavía no lanza modelos de lenguaje de gran tamaño capaces de competir en áreas más sofisticadas como la programación y la generación de texto, donde se encuentra por detrás de los líderes del mercado: Anthropic, Google y OpenAI.
“Todavía no podemos desarrollar modelos a gran escala, aunque nuestra capacidad de procesamiento aumentará lo suficiente como para permitirnos hacerlo a finales de este año”, declaró Suleyman, jefe de IA de la compañía, al Financial Times.
“Así que competimos en el segmento medio”, dijo, añadiendo que esto es “óptimo” en términos de equilibrio entre costo, desempeño, calidad y uso a gran escala.
Microsoft realiza fuertes inversiones para lograr la “autosuficiencia” en modelos de IA luego de reestructurar su relación exclusiva con OpenAI a finales del año pasado.
Trabaja en el desarrollo de modelos de vanguardia que le permitirán impulsar varios de sus servicios comerciales y de consumo sin depender de terceros.
Microsoft, que cuenta con uno de los negocios de computación en la nube más grandes del mundo, debe equilibrar la asignación de capacidad de centros de datos para sus propios proyectos internos de IA con clientes como OpenAI, así como con su software empresarial tradicional.
La compañía, al igual que otros proveedores, también se ve limitada en la entrega de capacidad debido a factores como la oposición local y la escasez de equipos, energía y mano de obra.
Los comentarios de Suleyman sugieren que estas limitaciones pesan en el desarrollo interno de IA.
Suleyman hizo estas declaraciones al Financial Times desde una reunión fuera de la oficina en Miami para el nuevo equipo de Superinteligencia del gigante de tecnología. Esta semana, él y el director ejecutivo Satya Nadella se dirigieron al grupo de 350 personas para hablar sobre “la hoja de ruta y los objetivos de Microsoft en el ámbito de la computación a largo plazo”.
El cofundador de Google DeepMind se unió a Microsoft en 2024 para liderar su iniciativa de IA para el consumidor. Creó el equipo de Superinteligencia a finales del año pasado, en medio de las renegociaciones contractuales entre Microsoft y OpenAI.
El nuevo acuerdo permite a OpenAI cerrar acuerdos de computación en la nube con los rivales de Microsoft, pero también libera al gigante del software para desarrollar sus propios modelos avanzados y competir directamente con la startup.
Microsoft presentó su primer modelo base, MAI-1, el año pasado, que, según la compañía, era un “modelo interno de combinación de expertos” que se entrenó con 15 mil GPU Nvidia H100. Este modelo se encuentra en fase de presentación preliminar y no está disponible para el público en general.
Suleyman contrató personal que le quitó a compañías rivales, como Google, y recientemente contrató a Ali Farhadi, exdirector ejecutivo del Instituto Allen en Seattle, para reforzar su equipo.
“La misión de nuestro laboratorio es lograr la autosuficiencia en IA para Microsoft en los próximos dos o tres años”, afirmó. “Esto implica construir clústeres (de chips) a escala de vanguardia e invertir en presupuestos de datos para que, en los próximos años, podamos alcanzar la tecnología más avanzada”.
Suleyman dijo que el equipo centra su atención en reducir los costos de las herramientas de IA y que su modelo de transcripción va a tener precios más bajos que los de la competencia. “Esperamos una enorme demanda”, añadió.
Su papel dentro de la empresa se redujo el mes pasado para enfocarse exclusivamente en el desarrollo de modelos. Pusieron a Jacob Andreou, antiguo ejecutivo de Snap, a cargo de todos los productos de IA de la marca Copilot y reporta directamente a Nadella.