Водещият китайски стартъп за изкуствен интелект, ДийпТърси, се оказва в центъра на спекулациите относно пускането на своя модел за разсъждение R2 от следващо поколение, следвайки OpenAIпускането на своя модел GPT-5 миналата седмица.
DeepSeek, която предизвика вълни в индустрията със своя V3 модел през декември и модела R1 през януари, не е въвела големи актуализации на своите продукти през последните месеци, с изключение на две малки ревизии.
Докато пазарът очакваше DeepSeek да представи нов модел на основата в рамките на месеци след пускането на R1, базираният в Ханджоу стартъп, основан от компютърния учен Лианг Уенфенг като страничен проект на неговата фирма за количествена търговия, все още не е обявил график за пускането на модела R2.
DeepSeek не отговори на искане за коментар в сряда.
Разработването и обучението на усъвършенстван модел е скъпа и сложна задача, изискваща значителни изчислителни ресурси и данни за обучение, както и сложни алгоритми. Отне на OpenAI две години и половина, за да пусне GPT-5 след пускането на GPT-4 през март 2023 г.
Сам Алтман, главен изпълнителен директор на производителя на ChatGPT OpenAI. Снимка: Ройтерс
Според доклад на The Financial Times в четвъртък, DeepSeek е отложила пускането на новия си модел поради предизвикателства при обучението му с чиповете Ascend AI на Huawei Technologies. Стартъпът се е сблъскал с „постоянни технически проблеми“ по време на процеса, се казва в доклада, който се позовава на неидентифициран източник.
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта