Цель: Разработать модель с использованием обучения с подкреплением (Reinforcement Learning), которая эффективно проходит трассы в нашей игре (аналог Hill Climb Racing), разработанной как Telegram Mini App с случайно генерируемыми трассами.
Задачи:
1. Тюнинг сложности трассы: Использовать модель для оценки и настройки сложности генерируемых трасс, чтобы обеспечить оптимальный игровой опыт для пользователей.
2. Анализ пределов прохождения: Определить, до какого момента пользователь может дойти, прежде чем у него закончится топливо, учитывая, что генерация топлива связана с пейволлом.
Требования:
- Обучение с подкреплением: Модель должна использовать алгоритмы RL для обучения эффективному прохождению трасс с учетом случайности их генерации.
- Взаимодействие с игрой: Необходимо обеспечить возможность модели взаимодействовать с игрой для получения состояний и отправки действий (например, газ, тормоз).
- Анализ и визуализация: Предоставить инструменты для визуализации прохождения и сбора статистики для дальнейшего анализа.
Возможные подходы к реализации:
1. JavaScript:
Реализовать модель непосредственно внутри игры, если это технически возможно.
2. Python + Selenium:
Использовать Selenium для автоматизации взаимодействия с игрой через веб-интерфейс Telegram.
Разделы:
Опубликован:
26.10.2024 | 19:03 [поднят: 26.10.2024 | 19:03]