Екипът на WeChat AI представя WeDLM: Нова рамка на дифузионен езиков модел за по-бързи паралелни изводи
Екипът на WeChat AI на Tencent предложи нова рамка за езиков модел, базирана на дифузия, наречена WeDLM (WeChat Diffusion Language Model), предназначена да преодолее тесните места на ефективността на паралелните изводи на традиционните големи езикови модели като серията GPT. Хартия и код: https://github.com/tencent/WeDLM WeDLM въвежда техника за топологично пренареждане, която интегрира дифузионни модели със стандартни…









