Bitget App
Trade smarter
Kup kryptoRynkiHandelFuturesEarnWeb3CentrumWięcej
Handel
Spot
Kupuj i sprzedawaj krypto
Margin
Zwiększ swój kapitał i wydajność środków
Onchain
Korzyści Onchain bez wchodzenia na blockchain
Konwersja i handel blokowy
Konwertuj kryptowaluty jednym kliknięciem i bez opłat
Odkryj
Launchhub
Zdobądź przewagę na wczesnym etapie i zacznij wygrywać
Kopiuj
Kopiuj wybitnego tradera jednym kliknięciem
Boty
Prosty, szybki i niezawodny bot handlowy AI
Handel
Kontrakty futures zabezpieczone USDT
Kontrakty futures rozliczane w USDT
Kontrakty futures zabezpieczone USDC
Kontrakty futures rozliczane w USDC
Kontrakty futures zabezpieczone monetami
Kontrakty futures rozliczane w kryptowalutach
Odkryj
Przewodnik po kontraktach futures
Podróż po handlu kontraktami futures – od początkującego do zaawansowanego
Promocje kontraktów futures
Czekają na Ciebie wysokie nagrody
Bitget Earn
Najróżniejsze produkty do pomnażania Twoich aktywów
Simple Earn
Dokonuj wpłat i wypłat w dowolnej chwili, aby uzyskać elastyczne zyski przy zerowym ryzyku
On-chain Earn
Codzienne zyski bez ryzykowania kapitału
Strukturyzowane produkty Earn
Solidna innowacja finansowa pomagająca poruszać się po wahaniach rynkowych
VIP i Wealth Management
Usługi premium do inteligentnego zarządzania majątkiem
Pożyczki
Elastyczne pożyczanie z wysokim bezpieczeństwem środków
Współzałożyciel Ethereum twierdzi, że zarządzanie oparte na AI może być wykorzystywane, wzywa do nadzoru nad info-finansami

Współzałożyciel Ethereum twierdzi, że zarządzanie oparte na AI może być wykorzystywane, wzywa do nadzoru nad info-finansami

CoinotagCoinotag2025/09/15 02:38
Pokaż oryginał
Przez:Jocelyn Blake

  • Vitalik Buterin ostrzega, że zarządzanie prowadzone przez AI może być manipulowane poprzez jailbreaki i integracje aplikacji.

  • Badacz bezpieczeństwa Eito Miyamura zademonstrował, jak integracje aplikacji mogą ujawniać prywatne dane na rzecz exploitów AI.

  • Architektury info finance z różnorodnymi modelami i ludzkimi kontrolami punktowymi są zalecane, aby zmniejszyć ryzyko systemowe.

Ryzyko zarządzania AI: Vitalik Buterin ostrzega, że zarządzanie prowadzone przez AI może być wykorzystywane — przeczytaj analizę, dowody i zalecane zabezpieczenia. Dowiedz się, co powinni zrobić decydenci i deweloperzy.




Czym jest ryzyko zarządzania AI?

Ryzyko zarządzania AI to zagrożenie, że autonomiczne systemy AI odpowiedzialne za podejmowanie decyzji — zwłaszcza w zakresie alokacji zasobów — mogą zostać zmanipulowane w celu wywołania szkodliwych skutków. Vitalik Buterin podkreśla, że bez warstwowych kontroli atakujący mogą używać promptów i integracji do obejścia logiki decyzyjnej i przekierowania środków lub danych.

Jak można zmanipulować systemy AI?

Agentów AI można oszukać za pomocą promptów jailbreak ukrytych w codziennych wejściach. Badacz bezpieczeństwa Eito Miyamura zademonstrował exploit, w którym zaproszenie do kalendarza lub integracja aplikacji mogły dostarczyć ukryte polecenie, które po przetworzeniu przez AI ujawnia zawartość e-maili lub plików.

Te exploity pokazują, że integracje aplikacji (przykłady: Gmail, Notion, Google Calendar wymienione jako kontekst) powiększają powierzchnię ataku. Atakujący mogą tworzyć wejścia, które wydają się nieszkodliwe, ale zmieniają zachowanie modelu podczas rutynowych zadań.

Dlaczego Vitalik Buterin sprzeciwia się w pełni autonomicznemu zarządzaniu AI?

Buterin twierdzi, że autonomiczne zarządzanie AI wzmacnia ryzyko systemowe. Zaleca podejście „info finance”, w którym wiele niezależnych modeli konkuruje i jest audytowanych przez ludzkie jury oraz automatyczne kontrole punktowe. Ta kombinacja ma na celu szybkie ujawnianie błędów modeli i utrzymanie motywacji do uczciwego rozwoju.

Jak zmniejszyć ryzyko zarządzania AI?

Praktyczne ograniczenie ryzyka wymaga warstwowych zabezpieczeń:

  1. Ograniczenie zakresu: zabronienie automatycznym systemom jednostronnego przesuwania środków lub podejmowania ostatecznych decyzji zarządczych.
  2. Różnorodność modeli: wdrożenie wielu modeli i porównywanie wyników w celu wykrycia anomalii.
  3. Nadzór ludzki: wymóg przeglądu ludzkiego dla decyzji wysokiego ryzyka i utrzymanie ścieżek audytu.
  4. Filtrowanie wejść: oczyszczanie i oznaczanie nieufnych wejść z aplikacji i współdzielonych kalendarzy.
  5. Zachęty i audyty: nagradzanie niezależnych audytorów i utrzymywanie programów bug-bounty.


Jakie dowody potwierdzają te obawy?

Zgłoszone demonstracje przez badaczy bezpieczeństwa ujawniły, jak można nadużywać integracji aplikacji. Eito Miyamura (EdisonWatch) pokazał scenariusz, w którym pozornie nieszkodliwe wpisy do kalendarza mogą wywołać wyciek danych po odczytaniu przez konwersacyjną AI. Takie demonstracje podkreślają rzeczywiste wektory ataku.

Porównanie: Zarządzanie AI vs Info Finance Cecha Zarządzanie AI (autonomiczne) Info Finance (propozycja Buterina)
Kontrola decyzji Tylko AI AI wspomagane + przegląd ludzki
Odporność na manipulacje Niska bez zabezpieczeń Wyższa dzięki różnorodności modeli
Przejrzystość Nieprzejrzyste wyniki modeli Audyty i kontrole punktowe
Zgodność motywacji Ryzyko manipulacji Zachęty dla audytorów i uczciwych deweloperów

Najczęściej zadawane pytania

Czy AI rzeczywiście można „uwięzić” lub oszukać promptami?

Tak. Demonstracje pokazały, że dobrze przygotowane prompt lub ukryte polecenia w wejściach mogą zmienić zachowanie AI. Praktyczne zabezpieczenia obejmują oczyszczanie wejść, łączenie modeli i ludzkie punkty kontrolne, aby zapobiec złośliwej manipulacji.

Czy DAO powinny przekazywać zarządzanie AI?

Obecne dowody sugerują, że przekazanie pełnej kontroli AI jest przedwczesne. Hybrydowe projekty wymagające zatwierdzenia przez człowieka dla kluczowych działań zmniejszają ryzyko katastrofalne, jednocześnie wykorzystując AI do analizy i rekomendacji.


Kluczowe wnioski

  • Ryzyko zarządzania AI jest realne: Demonstracje pokazują, że AI można manipulować za pomocą promptów i integracji.
  • Nadzór ludzki jest niezbędny: Wymagaj przeglądu ludzkiego i ścieżek audytu dla decyzji o wysokiej stawce.
  • Info finance oferuje bezpieczniejszą ścieżkę: Wiele modeli, kontrole punktowe i zachęty mogą zmniejszyć ryzyko wykorzystania.

Wnioski końcowe

Ostrzeżenie Vitalika Buterina podkreśla, że AI w zarządzaniu stanowi poważne zagrożenie systemowe, jeśli zostanie wdrożone bez zabezpieczeń. Dowody od badaczy bezpieczeństwa pokazują, że istnieją praktyczne exploity. Przyjęcie modelu info finance — łączącego różnorodność modeli, ciągłe audyty i obowiązkowy nadzór ludzki — oferuje pragmatyczną ścieżkę naprzód. Decydenci i twórcy powinni już teraz priorytetowo traktować audyty i struktury motywacyjne.

Opublikowano: 15 września 2025 | 02:50

Autor: Alexander Stefanov — Reporter w COINOTAG

Źródła wymienione (tekst): Vitalik Buterin, Eito Miyamura, EdisonWatch, ChatGPT, Gmail, Notion, Google Calendar.

Jeśli przegapiłeś: Przychody Trona napędzane stablecoinami mogą wzmacniać jego dominację rynkową
0

Zastrzeżenie: Treść tego artykułu odzwierciedla wyłącznie opinię autora i nie reprezentuje platformy w żadnym charakterze. Niniejszy artykuł nie ma służyć jako punkt odniesienia przy podejmowaniu decyzji inwestycyjnych.

PoolX: Stakuj, aby zarabiać
Nawet ponad 10% APR. Zarabiaj więcej, stakując więcej.
Stakuj teraz!