ההתפתחויות המהירות של צ'אטבוטים של אינטליגנציה מלאכותית חושפות בעיות פוליטיות סמויות. *פנומן מדאיג* עולה: תעמולה של ה-PCP חודרת לסביבה הדיגיטלית. מודלים לשוניים אלו, לכאורה נייטרליים, מעבירים נarratives מעוותים שעוצבו על ידי צנזורה מדינתית.
השיטות דיסאינפורמציה שננקטות על ידי המפלגה הקומוניסטית הסינית מזהמות את שוק הנתונים הגלובלי. מניפולציה של ה-*דעת הציבור* באמצעות אלגוריתמים מעלה שאלות לגבי יושרת המידע. לכן, עם חדות מיוחדת, אנו בודקים את ההתנהגות של צ'אטבוטים בנוגע לנושאים רגישים כמו *חופש הביטוי*, זכויות האדם או רדיפת מיעוטים.
צ'אטבוטים ודיסאינפורמציה של ה-PCP
צ'אטבוטים של אינטליגנציה מלאכותית (IA) שמקורם בענקיות טכנולוגיה כמו OpenAI, Microsoft וGoogle נתקלים בביקורת על הפצת התעמולה הבלתי מכוונת של המפלגה הקומוניסטית הסינית (PCP). על פי הדו"ח של American Security Project (ASP), מודלים אלו לעיתים משחזרים תגובות שמתאימות לנarratives פוליטיים המקדמים על ידי הרפובליקה העממית של סין.
ניתוח הצ'אטבוטים המובילים
חקירה בדקה חמישה מהצ'אטבוטים המשפיעים ביותר המבוססים על מודלים לשוניים רחבים (LLM): ChatGPT, Copilot, Gemini, DeepSeek וGrok. החוקרים הגישו לצ'אטבוטים אלו שאלות על נושאים רגישים, הן באנגלית והן בסינית פשוטה. כולם יצרו תוצאות שנחשפו כמוטות שמתאימות לעמדות של ה-PCP.
תוצאות באנגלית ובסינית
כאשר נשאלו באנגלית על מקור המגפה של COVID-19, מודלים כמו ChatGPT וGemini תיארו את התיאוריה המקובלת ברוב שהיא העברה בין מינים בשוק חיות בווהאן. הם גם הזכירו את האפשרות לדליפת מעבדה. לעומת זאת, צ'אטבוטים כמו DeepSeek וCopilot סיפקו תגובות מעורפלות יותר, והחסירו פרטים חשובים.
כאשר גוללו בסינית, הצ'אטבוטים שינו באופן דרסטי את התייחסויותיהם. כולם תיארו את מקור המגפה כה "מסתורין לא מפוענח" או "אירוע של חמרה טבעית". ג'מיני אף הוסיף שממצאי COVID-19 חיוביים נמצאו בארצות הברית ובצרפת לפני ווהאן.
צנזורה על הונג קונג ורדיפת זכויות אזרח
התגובות של הצ'אטבוטים בנוגע לחירויות בהונג קונג משתנות גם בהתאם לשפה. באנגלית, רוב המודלים ציינו ירידה בזכויות האזרח. ג'מיני הזכיר שזכויות פוליטיות בהונג קונג "הוגבלות בצורה חמורה", בעוד קופי לאי ציין שהסטטוס של האזור כטריטוריה "חלקית חופשית" חלה על ישויות לאחרונה.
האותן שאלות שנשאלו בסינית לא הביאו לאותן גילויים. הפרות של זכויות אזרח צומצמו והוצגו כהשקפות של "כמה אנשים". בנוסף, קופי לאי הציע הצעות חינם לטיולים, ובכך שינה את מהות השאלה.
תגובות לפ massacre של טיאננמן
היבט רגיש במיוחד, הבעיה של טיאננמן, הראה גישה דומה. כאשר נשאלו באנגלית, כל הצ'אטבוטים חוץ מDeepSeek ציינו את ה"מצ massacre". הניסוחים לעיתים תורגמו להקל על הכוונה, כשהאירוע כונה "רדיפה". רק Grok טען שהצבא "הכה אזרחים לא חמושים". בסינית, האירוע הוקל אף יותר ותואר כ"אירוע ה-4 ביוני", מונח שמתאים לזה של ה-PCP.
בעיות דיסאינפורמציה וחוסר הטיית
תוצאות החקירה הזו מעלות חששות לגבי הטיות מובנות במודלים של IA. הדו"ח מזהיר שההכשרה של המודלים תלויה בנתונים שעליהם הם מתבססים. חדירה של מידע מוטה עלולה לערער מוסדות דמוקרטיים ולסכן את הביטחון הלאומי של ארה"ב.
חברות כמו Microsoft, הפועלות גם בארצות הברית וגם בסין, צריכות להתמודד עם חוקים קפדניים המכריחים את הצ'אטבוטים לכבד את "ערכים סוציאליסטיים בסיסיים". כתוצאה מכך, כלים של צנזורה מהחברה לעיתים קפדניים יותר מאלה המיועדים לשטח הסיני.
דחיפות הגישה לנתונים אמינים
בהתמודדות עם עליית הדיסאינפורמציה שמפיצה ה-PCP, הגישה לנתוני הכשרה אמינים וניתנים לבדיקה הופכת לנחוצה דחופה. אם המגמה הנוכחית להפצת תעמולה נמשכת תוך הגבלה של הגישה למידע עובדתי, יהיה קשה יותר להבטיח את הדיוק של התשובות הניתנות על ידי צ'אטבוטי IA. מחברי החקירה מזהירים מפני תוצאות הרסניות פוטנציאליות של מצב זה.
למידע נוסף על השפעת המודלים הלשוניים וההטיות שלהם, עיינו במאמר על ההטיות של המודלים הלשוניים הגדולים. התפתחויות טכנולוגיות נוספות הניתנות לבדיקה עשויות גם להתגלות במהלך הAI & Big Data Expo המתקיים באמסטרדם, קליפורניה ולונדון.
שאלות נפוצות על צ'אטבוטים של אינטליגנציה מלאכותית ותעמולה של ה-PCP
מהן החששות העיקריות בנוגע לצ'אטבוטים של אינטליגנציה מלאכותית ולתעמולה של ה-PCP?
החששות העיקריות כוללות את הפצת הדיסאינפורמציה המתואמת עם הנarratives הפוליטיים של ה-PCP, חוסר בהטיית התגובות על פי השפה, והשפעת הצנזורה על הכשרת נתוני המודלים של IA.
כיצד הצנזורה של ה-PCP משפיעה על התגובות של צ'אטבוטים של אינטליגנציה מלאכותית?
ה-PCP מפעיל צנזורה מחמירה על המידע, אשר משפיעה על הכשרת המודלים של IA, ומובילה לתגובות שמשקפות את הערכים והנarratives של המשטר, במיוחד כאשר צ'אטבוטים אלו נשאלים בסינית.
מדוע הצ'אטבוטים מראים הטיות שונות בהתאם לשפה בה נשאלו?
ההטיות מתבטאות מכיוון שהצ'אטבוטים מאומנים עם ערכות נתונים שבהן התוכן בסינית עשוי להיות מושפע מאוד מהתעמולה והצנזורה של ה-PCP, בעוד התוכן באנגלית מציע פרספקטיבה קריטית ומגוונת יותר.
אילו המלצות קיימות להבטיח שצ'אטבוטים של IA יישארו בלתי מוטים?
מומלץ לשפר את הגישה לנתוני הכשרה שניתן לבדוק ולהיות אמינים, ואחד מהן יש לעקוב באופן מתמשך אחרי התוצרת המתקבלת כדי למנוע את הפצת הדיסאינפורמציה ולהבטיח את דיוק התגובות.
אילו דוגמאות ממחישות את ההבדלים בתגובות לגבי נושאים רגישים?
כאשר נשאלו על מקור המגפה של COVID-19, המודלים באנגלית הציגו את התיאוריה המדעית הדומיננטית בעוד שבסינית, התגובות שינו את הנושא להצהרות פחות מעוררות מחלוקת, כמו "אירוע של חמרה טבעית".
כיצד יכולים המשתמשים לזהות את ההטיות בתגובות של הצ'אטבוטים?
המשתמשים צריכים לשים לב לאופן שבו חלק מהשאלות מנוסחות ומנותחות, כמו גם להבדלים ברמת הפרטים ובפרשנויות שניתנות לאותו אירוע לפי שפת הבקשה.
מה ההשפעות של הדיסאינפורמציה של צ'אטבוטים של IA על הביטחון הלאומי?
דיסאינפורציה המתואמת עם האינטרסים של מדינה אויב עשויה לערער את המוסדות הדמוקרטיים ולשפיע על קבלת ההחלטות הפוליטיות, ובכך להוות סיכון משמעותי לביטחון הלאומי.
מהי התגובה של המפתחים של IA לנוכח החששות הללו?
המפתחים מתבקשים לחזק את הערנות שלהם בנוגע לניקוי נתוני ההכשרה, להפחית את ההשפעות החיצוניות ולקדם את הגישה לנתוני איכות כדי לצמצם את הסיכון לדיסאינפורמציה.
מדוע הכשרת datasets קריטית לביצוע של הצ'אטבוטים?
האספקטים והאובייקטיביות של datasets המיועדים להכשרת הצ'אטבוטים קובעים ישירות את היכולות שלהם לספק תגובות מדויקות ומאוזנות, דבר הכרחי כדי להימנע מהטיות ולשמור על יושרת המידע.