Microsoft, Üretken Yapay Zeka için Kırmızı Bir Ekip Oluşturma Aracı olan PyRIT'i Yayınladı
Microsoft, üretken yapay zeka (AI) sistemlerindeki riskleri proaktif olarak belirlemek için PyRIT (Python Risk Tanımlama Aracı'nın kısaltması) adlı bir açık erişim otomasyon çerçevesi yayımladı.
Microsoft'ta AI kırmızı ekip lideri Ram Shankar Siva Kumar, kırmızı ekip oluşturma aracının "dünyadaki her kuruluşun en son yapay zeka gelişmeleriyle sorumlu bir şekilde yenilik yapmasını sağlamak" için tasarlandığını söyledi.
Şirket, PyRIT'in büyük dil modeli (LLM) uç noktalarının fabrikasyon (örneğin halüsinasyon), kötüye kullanım (örneğin önyargı) ve yasaklanmış içerik (örneğin taciz) gibi farklı zarar kategorilerine karşı sağlamlığını değerlendirmek için kullanılabileceğini söyledi.
Kötü amaçlı yazılım oluşturmadan jailbreak yapmaya kadar değişen güvenlik zararlarının yanı sıra kimlik hırsızlığı gibi gizlilik zararlarını belirlemek için de kullanılabilir.
PyRIT beş arayüzle birlikte gelir: hedef, veri kümeleri, puanlama motoru, birden çok saldırı stratejisini destekleme yeteneği ve ara giriş ve çıkış etkileşimlerini depolamak için JSON veya veritabanı biçimini alabilen bir bellek bileşeni içerir.
Puanlama motoru ayrıca, hedef AI sisteminden elde edilen çıktıları puanlamak için iki farklı seçenek sunarak, kırmızı takım üyelerinin klasik bir makine öğrenimi sınıflandırıcısı kullanmasına veya kendi kendini değerlendirme için bir LLM uç noktasından yararlanmasına olanak tanır.
Microsoft, "Amaç, araştırmacıların modellerinin ve tüm çıkarım boru hattının farklı zarar kategorilerine karşı ne kadar iyi performans gösterdiğine dair bir temele sahip olmalarını ve bu temeli modellerinin gelecekteki yinelemeleriyle karşılaştırabilmelerini sağlamaktır" dedi.
"Bu, modellerinin bugün ne kadar iyi performans gösterdiğine dair ampirik verilere sahip olmalarını ve gelecekteki iyileştirmelere dayalı olarak herhangi bir performans düşüşünü tespit etmelerini sağlıyor."
Bununla birlikte, teknoloji devi, PyRIT'in üretken yapay zeka sistemlerinin manuel kırmızı ekip çalışmasının yerini almadığını ve kırmızı bir ekibin mevcut alan uzmanlığını tamamladığını vurgulamaya özen gösteriyor.
Başka bir deyişle, araç, AI sistemini değerlendirmek ve daha fazla araştırma gerektiren alanları işaretlemek için kullanılabilecek istemler oluşturarak risk "sıcak noktalarını" vurgulamayı amaçlamaktadır.
Microsoft ayrıca, üretken yapay zeka sistemlerini kırmızı ekip haline getirmenin aynı anda hem güvenlik hem de sorumlu yapay zeka risklerini araştırmayı gerektirdiğini ve alıştırmanın daha olasılıklı olduğunu kabul ederken, üretken yapay zeka sistem mimarilerindeki büyük farklılıklara da dikkat çekti.
Siva Kumar, "Manuel sondalama, zaman alıcı olsa da, potansiyel kör noktaları belirlemek için genellikle gereklidir" dedi. "Ölçeklendirme için otomasyona ihtiyaç duyuluyor ancak manuel prob ile ölçüm için bir zorunluluk söz konusu değil."
Geliştirme, Protect AI'nin ClearML, Hugging Face, MLflow ve Triton Inference Server gibi popüler AI tedarik zinciri platformlarında rastgele kod yürütülmesine ve hassas bilgilerin ifşa edilmesine neden olabilecek çok sayıda kritik güvenlik açığını ifşa etmesiyle geldi.
Diğer haberlerimiz hakkında daha fazla bilgi için Twitter sayfamızı, Instagram sayfamızı ve LinkedIn sayfamızı takip etmeyi unutmayın.
Benzer Haberler
Concentric AI, DSPM Teknolojisini Genişletmek için 45 Milyon Dolarlık B Serisi Finansman Sağladı
Apple, Araştırmacıların Bulut Yapay Zeka Güvenliğindeki Hataları Belirlemesi için PCC Kaynak Kodunu Açıyor
Araştırmacılar, Jailbreak Yapay Zeka Modellerine 'Aldatıcı Zevk' Yöntemini Açıkladı
Meta, Birleşik Krallık'taki herkese açık Facebook ve Instagram gönderilerini kullanarak yapay zeka modellerini eğitecek
Mastercard, Tehdit İstihbarat Firması Recorded Future'ı 2,6 Milyar Dolara Satın Alacak
Telegram, OTP göndermek için numaranızı kullanmanız karşılığında premium abonelik sunar
GitHub, Geliştiricilerin Güvenlik Kusurlarını Yamalamalarına Yardımcı Olmak için Yapay Zeka Destekli Otomatik Düzeltme Aracını Başlattı
Deepfakes'ten Kötü Amaçlı Yazılıma: Yapay Zekanın Siber Saldırılarda Genişleyen Rolü