ΑρχικήinetΗ Meta λανσάρει το LlamaFirewall Framework για συστήματα AI

Η Meta λανσάρει το LlamaFirewall Framework για συστήματα AI

Η Meta ανακοίνωσε την Τρίτη το LlamaFirewall, ένα ανοιχτού κώδικα πλαίσιο (framework) που έχει σχεδιαστεί για να προστατεύει τα συστήματα τεχνητής νοημοσύνης (AI) από αναδυόμενους κινδύνους στον κυβερνοχώρο, όπως η εισαγωγή παραπλανητικών εντολών (prompt injection), οι προσπάθειες παράκαμψης περιορισμών (jailbreaks) και ο μη ασφαλής κώδικας, μεταξύ άλλων.

Δείτε επίσης: ΕΕ: Πρόστιμα σε Apple και Meta για παραβίαση του Νόμου DMA

Advertisement
LlamaFirewall Framework

Σύμφωνα με την εταιρεία, το πλαίσιο περιλαμβάνει τρεις βασικές δικλείδες ασφαλείας: PromptGuard 2, Agent Alignment Checks και CodeShield.

Το PromptGuard 2 έχει σχεδιαστεί για να εντοπίζει σε πραγματικό χρόνο άμεσες απόπειρες jailbreak και prompt injection. Το Agent Alignment Checks είναι ικανό να αναλύει τη συλλογιστική των AI agents για ενδεχόμενη εκτροπή στόχων ή έμμεσες απόπειρες prompt injection. Τέλος, το CodeShield είναι μια διαδικτυακή μηχανή στατικής ανάλυσης που στοχεύει στην αποτροπή παραγωγής μη ασφαλούς ή επικίνδυνου κώδικα από πράκτορες τεχνητής νοημοσύνης.

Παράλληλα με το LlamaFirewall framework, η Meta διέθεσε ανανεωμένες εκδόσεις των LlamaGuard και CyberSecEval, με στόχο την καλύτερη ανίχνευση συνηθισμένων τύπων παραβατικού περιεχομένου και την αξιολόγηση των δυνατοτήτων κυβερνοασφάλειας των συστημάτων τεχνητής νοημοσύνης, αντίστοιχα.

Δείτε ακόμα: Meta: Θα αναγκαστεί να πουλήσει Instagram και WhatsApp;

Η νέα έκδοση CyberSecEval 4 περιλαμβάνει επίσης ένα νέο benchmark με την ονομασία AutoPatchBench, το οποίο έχει σχεδιαστεί για να αξιολογεί την ικανότητα ενός πράκτορα μεγάλου γλωσσικού μοντέλου (LLM) να επιδιορθώνει αυτόματα μια ευρεία γκάμα ευπαθειών σε C/C++ που εντοπίζονται μέσω της μεθόδου fuzzing — μια προσέγγιση γνωστή ως επιδιόρθωση με τη βοήθεια τεχνητής νοημοσύνης (AI-powered patching).

Η Meta λανσάρει το LlamaFirewall Framework για συστήματα AI

Τέλος, η Meta παρουσίασε το νέο πρόγραμμα Llama for Defenders, με σκοπό να βοηθήσει συνεργαζόμενους οργανισμούς και προγραμματιστές AI να αποκτήσουν πρόσβαση σε ανοικτές, δοκιμαστικές και περιορισμένης πρόσβασης λύσεις AI για την αντιμετώπιση συγκεκριμένων προκλήσεων ασφάλειας, όπως η ανίχνευση περιεχομένου που δημιουργείται από AI και χρησιμοποιείται σε απάτες, παραπλανήσεις και επιθέσεις phishing.

Οι ανακοινώσεις αυτές έρχονται καθώς η WhatsApp παρουσίασε προεπισκόπηση μιας νέας τεχνολογίας με την ονομασία Private Processing, που επιτρέπει στους χρήστες να αξιοποιούν λειτουργίες AI χωρίς να θυσιάζουν την ιδιωτικότητά τους, εκτελώντας τα σχετικά αιτήματα σε ασφαλές και εμπιστευτικό περιβάλλον.

Δείτε επίσης: Η Meta εισάγει τα Teen Accounts στο Facebook και το Messenger

Κάτι σχετικό με τα παραπάνω είναι η αυξανόμενη ανάγκη για ασφαλή ενσωμάτωση της τεχνητής νοημοσύνης σε κρίσιμες υποδομές και εφαρμογές, καθώς τα γλωσσικά μοντέλα (όπως αυτά που βασίζονται στο LLaMA) γίνονται ολοένα και πιο ισχυρά και διαδεδομένα. Η Meta και άλλες εταιρείες αναπτύσσουν εργαλεία όπως το LlamaFirewall, το CyberSecEval και το CodeShield για να αντιμετωπίσουν κινδύνους όπως παραπλανητικές εντολές, παραβίαση περιορισμών, παραγωγή κακόβουλου κώδικα ή κατάχρηση της AI από επιτιθέμενους.

Πηγή: thehackernews

Absenta Mia
Absenta Miahttps://www.secnews.gr
Being your self, in a world that constantly tries to change you, is your greater achievement
spot_img

Εγγραφή στο Newsletter

* indicates required

FOLLOW US

LIVE NEWS