Нові дані Statista показали, що чатботи зі штучним інтелектом — зокрема ChatGPT — найчастіше використовують Reddit як джерело інформації. На другому місці — Wikipedia, але її частка майже вдвічі менша, пише Anadolu Agency.
За даними статистичного порталу Statista, чат-боти зі штучним інтелектом (ШІ), або великі мовні моделі (LLM), такі як ChatGPT, збирають більшу частину своїх даних з коментарів на Reddit.
LLM набули широкої популярності з появою ChatGPT і стали невід'ємною частиною нашого повсякденного життя з запуском декількох моделей, таких як Google Gemini, китайська DeepSeek, Meta's Llama і Grok від соціальної мережі X.
Дані показали, що багато LLM, включаючи ChatGPT, використовують загальнодоступні веб-сайти для генерації відповідей.
За даними Statista, Reddit очолює список джерел, на які посилаються LLM, з часткою 40,11%.
Експерти зазначають, що використання Reddit, де користувачі обговорюють конкретні теми з безлічі питань, розділених на так звані «субреддіти», свідчить про те, що при розробці чат-ботів на базі штучного інтелекту пріоритет надається природним розмовам між реальними людьми, а не офіційній інформації.
Після Reddit найчастіше цитованою платформою LLM була Вікіпедія з часткою 26,3%, яка значно відстає від Reddit, оскільки вона містить редаговані статті, а не модель соціальної медіаплатформи, на якій працює Reddit.
YouTube мав частку 23,5%, за ним йшли Google з 23,2%, yelp.com з 21%, Facebook з 19,9%, Amazon з 18,7%, Tripadvisor з 12,4%, mapbox.com з 11,2% та openstreetmap.com з 11,2%.
Тим часом на перший план вийшли деякі угоди між соціальними мережами та виробниками штучного інтелекту.
За повідомленням Reuters, Google і Reddit у 2024 році уклали угоду про надання даних Google для штучного інтелекту за 60 мільйонів доларів на рік. Reddit підписав подібну угоду про обмін даними з OpenAI для ChatGPT.