Нова китайська ШІ-модель вважає себе ChatGPT: чому це трапляється
Ось як може виглядати новина, базована на вказаних даних:
Минулого тижня китайська лабораторія штучного інтелекту презентувала нову модель DeepSeek V3, яка вже здобула популярність завдяки високим результатам у тестах на програмування та написання текстів. Однак ця модель має особливість, яка викликає подив: вона ідентифікує себе як ChatGPT, зазначаючи, що належить до версії GPT-4, випущеної у 2023 році.
Що сталося?
За даними TechCrunch, ймовірно, модель DeepSeek була частково навчена на даних, створених ChatGPT, що й могло стати причиною такої поведінки. У відкритих джерелах є багато текстів, згенерованих GPT-4, і китайська лабораторія могла використати їх для тренування своєї системи.
«Це може бути випадковістю, але є підстави вважати, що DeepSeek отримує необроблені відповіді від ChatGPT», — коментує Майк Кук, науковий співробітник Королівського коледжу Лондона. Він попереджає, що навчання моделей на результатах конкурентів може погіршити їх якість, спричиняючи галюцинації та помилки.
Юридичні й етичні питання
Правила OpenAI, творця ChatGPT, забороняють використовувати його відповіді для створення конкурентних моделей. У той час як жодна з компаній не коментує ситуацію, CEO OpenAI Сем Альтман зауважив у своєму дописі:
«Легко копіювати те, що вже працює, але надзвичайно важко створювати щось нове та ризиковане».
Чи це поодинокий випадок?
Цікаво, що DeepSeek V3 не єдина модель, яка помилково ідентифікує себе. Наприклад, Google Gemini під час запитів китайською мовою заявляла, що є чатботом Wenxinyiyan від Baidu.
Ця ситуація підкреслює важливість етичного підходу до тренування ШІ-моделей та відкриває дискусію щодо впливу копіювання на якість і розвиток технологій.
Як вам такий формат?