Ф'ючерси
Сотні безстрокових контрактів
TradFi
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
Launchpad
Будьте першими в наступному великому проекту токенів
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Центр багатства VIP
Преміальні плани зростання капіталу
Управління приватним капіталом
Розподіл преміальних активів
Квантовий фонд
Квантові стратегії найвищого рівня
Стейкінг
Стейкайте криптовалюту, щоб заробляти на продуктах PoS
Розумне кредитне плече
Кредитне плече без ліквідації
Випуск GUSD
Мінтинг GUSD для прибутку RWA
Етан Моллік ділиться інформацією про LLM, навчану цілком на текстах епохи Вікторії
Ітан Моллік ділиться LLM, навченою виключно на текстах епохи Вікторіанства
Резюме
Ітан Моллік твітнув про велику мовну модель, навчена з нуля на понад 28,000 британських текстах з вікторіанської епохи (1837-1899), всі отримані з набору даних Британської бібліотеки. Модель має на меті виробляти автентичну історичну мову та перспективи, не покладаючись на сучасну LLM, яка претендує на те, щоб бути вікторіанською. Обмежуючи навчальні дані джерелами, специфічними для епохи, розробники сподіваються отримати більш точні симуляції того, як люди насправді писали та думали в ту епоху. Це важливо, оскільки показує один з способів створення моделей, специфічних для домену, які обходять сучасні упередження — корисні для освіти, культурного збереження та історичних досліджень.
Аналіз
Схожі проекти існують: TimeCapsuleLLM навчена на текстах Лондона 1800-1875 років, а Violet LLM використовувала джерела 1800-1899 років, включаючи дані Британської бібліотеки. Вони зазвичай використовують архітектури на зразок nanoGPT або GPT-NeoX. TimeCapsuleLLM дала деякі несподівані результати — вона змогла згадати реальні події 1834 року з шаблонів лише з 15 ГБ навчальних даних, без явних історичних фактів.
Підхід з нуля, використовуючи набори даних з відкритим доступом, вписується в ширшу тенденцію: хобісти та академічні проекти створюють спеціалізовані моделі, а не покладаються на універсальні системи. Компроміс очевидний — ви отримуєте автентичні результати епохи, але втрачаєте широту моделі класу GPT-4.
Я повинен зазначити: конкретна модель, на яку посилався Моллік, залишається невизначеною. Його твіт з’явився менше ніж за годину до цього аналізу, а пошуки по Hugging Face, GitHub і репозиторіях Британської бібліотеки виявили лише згадані вище старі проекти. Деталі тут запозичені з тих схожих зусиль, а не з точної моделі з твіту.
Якщо ця нова модель буде публічно випущена з документацією, це може викликати більший інтерес до історичних LLM для культурного аналізу. Проте існують реальні виклики — якість OCR з джерел 19-го століття варіюється, а набір даних blbooks Британської бібліотеки з 25 мільйонів сторінок містить безліч артефактів сканування.
Оцінка впливу