شهدت الأيام الأخيرة إتهامات متبادلة بين شركات التكنولوجيا، حيث إتهمت شركات مثل Freelancer و iFixit الشركات الناشئة في مجال الذكاء الاصطناعي مثل أنثروبيك ( Anthropic ) بإنتهاك بروتوكول robots.txt، الذي يحدد الصفحات التي يمكن لبرامج الزحف الوصول إليها. هذه الإتهامات سلطت الضوء على التحديات المتزايدة المتعلقة بجمع بيانات التدريب لتطوير نماذج الذكاء الاصطناعي.
زعم Matt Barrie، الرئيس التنفيذي لشركة Freelancer، أن روبوت ClaudeBot التابع لشركة أنثروبيك ( Anthropic ) قام بزيارة موقعه الإلكتروني 3.5 مليون مرة خلال أربع ساعات فقط، مما تسبب في إبطاء الموقع وتأثير محتمل على الإيرادات. في الوقت نفسه، أكد Kyle Wiens، الرئيس التنفيذي لشركة iFixit، أن الروبوت الخاص بشركة أنثروبيك قام بزيارة خوادم iFixit مليون مرة في غضون 24 ساعة، مما أدى إلى إستنزاف موارد الموقع.

على الرغم من أن الامتثال لبروتوكول robots.txt يكون طوعيًا في الغالب، إلا أن الشركات المتضررة إتخذت تدابير لحماية بياناتها. قامت Freelancer بحظر الزاحف الخاص بشركة Anthropic تمامًا، بينما قامت iFixit بإضافة سطر في ملف robots.txt الخاص بها لمنع روبوت Anthropic بشكل خاص. من جانبها، أكدت Anthropic أنها تحترم بروتوكول robots.txt وأنها تسعى لتقليل الإضطراب الذي يتسبب فيه برنامج الزحف الخاص بها عن طريق التحكم في معدل زحفها للمواقع.
يأتي هذا الخلاف في سياق الجهود المتزايدة من قبل شركات الذكاء الاصطناعي لجمع بيانات التدريب اللازمة لتطوير نماذج الذكاء الاصطناعي الخاصة بها. وقد أدى هذا إلى رفع العديد من الدعاوى القضائية ضد هذه الشركات بتهمة انتهاك حقوق النشر. في محاولة لتجنب المزيد من المشاكل القانونية، قامت بعض الشركات مثل OpenAI بعقد صفقات مع الناشرين ومواقع الويب مثل News Corp و Vox Media و The Financial Times و Reddit للحصول على محتوى مرخص.
الملخص
شهدت الأيام الأخيرة خلافًا بين شركات التكنولوجيا، حيث اتهمت شركات مثل Freelancer و iFixit الشركات الناشئة في مجال الذكاء الاصطناعي مثل Anthropic بانتهاك بروتوكول robots.txt، الذي يحدد الصفحات التي يمكن لبرامج الزحف الوصول إليها. وقد قامت الشركات المتضررة بحظر أو تقييد وصول الزاحف الخاص بشركة Anthropic، في حين أكدت Anthropic أنها تحترم هذا البروتوكول وتسعى لتقليل الإضطراب الذي يسببه برنامج الزحف الخاص بها.
يأتي هذا الخلاف في سياق الجهود المتزايدة من قبل شركات الذكاء الاصطناعي لجمع بيانات التدريب اللازمة لتطوير نماذج الذكاء الاصطناعي الخاصة بها، مما أدى إلى رفع العديد من الدعاوى القضائية ضد هذه الشركات بتهمة انتهاك حقوق النشر. في محاولة لتجنب المزيد من المشاكل القانونية، قامت بعض الشركات مثل OpenAI بعقد صفقات مع الناشرين ومواقع الويب للحصول على محتوى مرخص.