Meta refuerza la seguridad de la IA con nuevas herramientas Llama

Publié le 1 mayo 2025 à 09h12
modifié le 1 mayo 2025 à 09h13

La maduración de la IA requiere una vigilancia aumentada en el universo tecnológico. Las nuevas amenazas exigen soluciones efectivas. Meta, consciente de los desafíos generados por su desarrollo, ha revelado una serie de herramientas revolucionarias para fortalecer la seguridad de los modelos Llama. La integración de la IA abre perspectivas revolucionarias. Estas innovaciones buscan proteger no solo a los usuarios, sino también a los desarrolladores frente a un paisaje digital cada vez más complejo. La seguridad se convierte en una preocupación primordial. Para navegar en este contexto, Meta propone herramientas refinadas, destinadas a asegurar el ecosistema de IA con rigor y eficacia.

Meta refuerza la seguridad de los modelos Llama

Meta ha revelado recientemente herramientas de seguridad mejoradas para sus modelos de IA Llama, señalando un avance importante en la protección de las tecnologías de inteligencia artificial. Estas herramientas están destinadas a ayudar a los equipos de ciberseguridad a utilizar la IA de manera más segura al tiempo que refuerzan las estructuras existentes.

Nuevas herramientas de protección Llama

Entre las nuevas funcionalidades, Llama Guard 4 representa una evolución significativa. Esta versión multimodal incluye filtros de seguridad adaptables no solo para el texto, sino también para las imágenes. Esta evolución responde a las crecientes necesidades de aplicaciones de IA visuales y está integrada en la nueva Llama API, actualmente en fase de vista previa limitada.

Control de seguridad con LlamaFirewall

LlamaFirewall representa un complemento esencial al dispositivo de seguridad de las IA. Su función es actuar como un centro de control de seguridad para los sistemas de IA. Esta herramienta facilita la gestión de los diferentes modelos de seguridad que operan en colaboración al mismo tiempo que se conecta a otros instrumentos de protección de Meta.

Las capacidades de detección de LlamaFirewall incluyen la identificación y bloqueo de riesgos que podrían perturbar el buen funcionamiento de las IA. Entre estos se encuentran ataques de tipo ‘inyección de prompts’ que buscan manipular la IA, generaciones de código potencialmente dañinas así como comportamientos de riesgo asociados a los plug-ins de IA.

Mejora de Llama Prompt Guard

La actualización del Llama Prompt Guard permite un refuerzo considerable frente a los intentos de jailbreak y a las inyecciones de prompts. Este modelo principal, Prompt Guard 2 (86M), ha sido optimizado, afirmando su capacidad para detectar amenazas de manera más eficaz.

Una nueva variante, Prompt Guard 2 22M, ofrece una opción más ligera, permitiendo reducir la latencia y los costos de cálculo hasta un 75 % en comparación con su predecesor. Este desarrollo es esencial para las organizaciones que buscan respuestas más rápidas mientras cumplen con restricciones presupuestarias.

Herramientas de ciberseguridad para los defensores

Meta también ha escuchado los llamados de los profesionales de ciberseguridad, desarrollando herramientas específicamente diseñadas para la defensa contra ciberataques. La actualización de la suite de benchmarks CyberSec Eval 4 tiene como objetivo evaluar la eficacia de los sistemas de IA en materia de seguridad.

La nueva herramienta CyberSOC Eval, elaborada en colaboración con expertos en ciberseguridad como CrowdStrike, permite evaluar el rendimiento de la IA en entornos reales de centros de operaciones de seguridad. Otro añadido, AutoPatchBench, se centra en la capacidad de los modelos Llama para identificar y corregir automáticamente vulnerabilidades en el código antes de la explotación maliciosa.

Programa Llama Defenders

Para facilitar el acceso a las nuevas soluciones, Meta lanza el Programa Llama Defenders, destinado a socios y desarrolladores. Este programa ofrece acceso privilegiado a una variedad de herramientas de IA, incluyendo opciones de código abierto y exclusivas, adaptadas a diversos desafíos de seguridad.

Este programa también pone a disposición la herramienta de clasificación automática de documentos sensibles, desarrollada internamente por Meta. Su objetivo es marcar de manera segura los documentos, previniendo así las filtraciones de información sensible o su uso inapropiado en sistemas de IA como en las configuraciones RAG.

Detección del audio generado por la IA

El problema del audio falsificado, que se ha convertido en una herramienta común en las estafas, es otra prioridad para Meta. Las herramientas Llama Generated Audio Detector y Llama Audio Watermark Detector están disponibles para los socios para identificar las voces generadas por la IA en llamadas de phishing o intentos de fraude. Empresas como ZenDesk, Bell Canada y AT&T ya están comprometidas en la integración de estas tecnologías.

Tecnología de procesamiento privado

Una innovación potencialmente revolucionaria se perfila con el procesamiento privado en WhatsApp. Esta tecnología permitirá a la IA realizar tareas útiles, como la síntesis de mensajes no leídos o la ayuda en la redacción de respuestas, sin que Meta o WhatsApp accedan al contenido de esos mensajes.

Meta toma medidas transparentes respecto a la seguridad de estos sistemas, publicando su modelo de amenaza e invitando a investigadores de seguridad a probar la robustez de su arquitectura antes del despliegue. Un enfoque que demuestra su voluntad de asegurar la privacidad de los usuarios.

Preguntas frecuentes sobre la seguridad de la IA con las nuevas herramientas Llama de Meta

¿Qué herramientas de seguridad ha lanzado recientemente Meta para los modelos Llama?
Meta ha introducido varias nuevas herramientas de seguridad para los modelos Llama, incluyendo Llama Guard 4, LlamaFirewall, y una actualización de Llama Prompt Guard. Estas herramientas están destinadas a reforzar la seguridad en el uso de la IA.

¿Cómo mejora Llama Guard 4 la seguridad de los modelos Llama?
Llama Guard 4 es un filtro de seguridad avanzado y multimodal que aplica reglas de seguridad no solo al texto, sino también a las imágenes, lo que es esencial para las aplicaciones de IA cada vez más visuales.

¿En qué consiste LlamaFirewall y cuál es su función?
LlamaFirewall funciona como un centro de control de seguridad para los sistemas de IA, permitiendo gestionar varios modelos de seguridad y detectar amenazas como ataques de ‘injection de prompts’ y otros comportamientos de riesgo.

¿Qué es Prompt Guard 2 22M y cuáles son sus mejoras en comparación con su predecesor?
Prompt Guard 2 22M es una versión más compacta y rápida del modelo principal, que promete reducir la latencia y los costos de cálculo hasta un 75 % manteniendo una buena capacidad de detección de intentos de jailbreak.

¿Cómo ayuda Meta a los equipos de ciberseguridad con la herramienta CyberSec Eval 4?
CyberSec Eval 4 es una suite de evaluación de código abierto que ayuda a las organizaciones a evaluar la eficacia de los sistemas de IA en la detección y respuesta a amenazas en entornos de seguridad reales.

¿Qué es el programa Llama Defenders de Meta?
El programa Llama Defenders tiene como objetivo proporcionar a empresas socias y desarrolladores acceso exclusivo a una variedad de soluciones de IA, incluyendo herramientas de seguridad, con el fin de abordar desafíos específicos de seguridad.

¿Cómo funciona la herramienta de Clasificación Automática de Documentos Sensibles?
Esta herramienta asigna automáticamente etiquetas de seguridad a los documentos dentro de una organización, ayudando a prevenir filtraciones de información sensible y evitando que sean tratados por sistemas de IA de forma inapropiada.

¿Cuáles son los nuevos desarrollos de Meta en cuanto a la detección de audio generado por la IA?
Meta ha introducido el Llama Generated Audio Detector y el Llama Audio Watermark Detector para ayudar a identificar las voces generadas por la IA en llamadas de phishing o intentos de fraude, reforzando así la seguridad digital.

¿Qué es el procesamiento privado que planea Meta para WhatsApp?
El procesamiento privado permitiría a los usuarios de IA gestionar tareas útiles como la redacción de respuestas sin que Meta o WhatsApp tengan acceso al contenido de los mensajes, fortaleciendo así la privacidad de las comunicaciones.

actu.iaNon classéMeta refuerza la seguridad de la IA con nuevas herramientas Llama

la teoría sobre el dispositivo de hardware de IA de Jony Ive se vuelve cada vez más creíble

explorez la théorie captivante sur le dispositif matériel d'intelligence artificielle imaginé par jony ive, qui gagne en crédibilité. découvrez comment ses concepts innovants pourraient révolutionner notre interaction avec la technologie et redéfinir l'avenir des objets connectés.

cómo la inteligencia artificial ha invertido en el mundo de la perfumería

découvrez comment l'intelligence artificielle transforme l'industrie de la parfumerie, de la création de nouvelles fragrances à l'optimisation des procédés, en alliant innovation technologique et art de la senteur.

La influencia de la IA en nuestro lenguaje: un estudio revela que el humano se expresa como ChatGPT

découvrez comment l'intelligence artificielle, à travers des outils comme chatgpt, façonne notre manière de communiquer. cette étude approfondie révèle des tendances fascinantes sur l'évolution de notre langage et les similitudes croissantes entre les expressions humaines et celles générées par l'ia.

Thomas Wolf de Hugging Face: la ambición de democratizar la robótica a través del código abierto

découvrez comment thomas wolf, co-fondateur de hugging face, vise à démocratiser la robotique grâce à l'open source. explorez ses idées innovantes et son engagement pour rendre la technologie accessible à tous.

los 20 modelos de ia más eficientes de junio de 2025: descubre el ranking detallado

découvrez notre classement détaillé des 20 modèles d'intelligence artificielle les plus performants de juin 2025. explorez les innovations et les avancées qui façonnent l'avenir de la technologie.

Cédric O enfrenta acusaciones de conflicto de intereses, pero cuenta con el apoyo de la HATVP

découvrez comment cédric o se retrouve au cœur de controverses concernant des accusations de conflit d'intérêts, tout en recevant le soutien inattendu de la haute autorité pour la transparence de la vie publique (hatvp).