tgoop.com/seeallochnaya/733
Create:
Last Update:
Last Update:
Спите? А надо просыпаться - OpenAI раздуплились и выложили ИССЛЕДОВАТЕЛЬСКУЮ статью про DALLE-3.
Читать: https://cdn.openai.com/papers/dall-e-3.pdf
Краткое саммари:
Существующие text-2-image модели с трудом следуют подробным описаниям изображений и часто игнорируют слова или путают смысл промптов. Исследователи предполагают, что эта проблема связана с шумными и неточными подписями к изображениям в тренировочной выборке. OpenAI решает эту проблему, обучая отдельную модель для описания изображений и затем используют его для преобразования датасета.
Но клиффхэнгер тоже есть
DALL-E 3 has many improvements over DALL-E 2, many of which are not covered in this document and could not be ablated for time and compute reasons.