|
|
Машинное обучение и искусственный интеллект
Что это такое?
Здесь размещены разработанные автором практические работы для старшеклассников
(10-11 классы) по теме «Машинное обучение и искусственный интеллект».
Материалы для каждой работы включают:
- презентацию;
- рабочую тетрадь c заданием;
- блокнот Jupiter;
- файлы с данными;
- ответы и решения.
Предусмотрено три уровня выполнения каждой работы: А — базовый,
B — повышенный и C — высокий.
1 февраля 2026 г.
Размещена практическая работа 13 «Обработка естественного языка».
27 января 2026 г.
Доработаны материалы работы 10 «Многоклассовая классификация».
19 января 2026 г.
Размещена практическая работа 12 «Свёрточные нейронные сети».
12 января 2026 г.
Размещена первая версия практических работ.
Практические работы
- Введение
Jupyter Notebook. Библиотека Pandas.
Чтение CSV-файлов. Работа с таблицей (DataFrame). Преобразования столбцов.
Фильтрация. Группировка. Поиск. Сортировка. Предварительная очистка данных.
Визуализация данных.
- Временные ряды
Построение графиков. Обучающие и тестовые данные. Метод наименьших квадратов.
Коэффициент детерминации. Работа с массивами NumPy. Линейная модель. Приближение полиномами.
Приближение произвольными функциями. Параметрическая оптимизация.
- Линейная регрессия
Линейная модель регрессии для одной и нескольких переменных.
Пакет Scikit-learn. Обучающие и тестовые данные. Обучение модели.
Визуализация с помощью библиотеки Seaborn.
- Линейный классификатор
Преобразование категориальных данных в числовые. Визуализация с помощью Matplotlib.
Построение линейных границ. Сигмоида. Функции потерь. Бинарная кросс-энтропия.
Логистическая регрессия. Градиентный спуск. Частные производные. Скорость обучения.
Матрица ошибок. Оценка качества модели: accuracy, precision, recall, F1-score.
- Ближайшие соседи (метод K-NN)
Методы ближайшего соседа и N ближайших соседей. Гиперпараметры.
Переобучение. Недообучение. Масштабирование данных.
- Деревья принятия решений
Проблема переобучения. Оптимальное деление. Оценка неоднородности узла (индекс Джини).
Обучение и исследование модели с помощью Scikit-learn. Изображение дерева.
Случайный лес. Bootstrap-выборки. Кросс-валидация (перекрёстная проверка).
- Ассоциативные правила
Поиск закономерностей в данных. Предварительная подготовка данных.
Частота встречаемости (support). Уверенность (confidence). Улучшение (lift).
Алгоритм Apriory. Визуализация данных.
- Классификация. Один нейрон
Задачи классификации (бинарная, многоклассовая).
Модель нейрона Мак-Каллока и Питтса. Перцептрон Розенблатта.
Нейрон как линейный классификатор. Активационные функции: ступенчатая, сигмоида.
Обучение нейронной сети. Правило Хэбба. Функция потерь. Градиентный спуск. Скорость обучения.
Вычисление частных производных. Обратное распространение ошибки.
Матричная запись операций.
- Сеть со скрытым слоем
Структура сети со скрытыми слоями. Активация ReLU. Матричная запись операций.
Обратное распространение ошибки.
- Многоклассовая классификация
Постановка задачи. Желаемый выход сети: логиты и «вероятности».
Функция softmax. Функция потерь — кросс-энтропия.
Обратное распространение ошибки.
- Многослойная сеть
Структура многослойной нейронной сети. Набор данных MNIST.
Стохастический градиентный спуск. Пакетный градиентный спуск.
Создание и обучение модели в Scikit-learn. Подбор гиперпараметров.
- Свёрточные нейронные сети
Свёртка. Ядро. Дополнение (padding). Структура многослойной свёрточной нейронной сети.
Слои пулинга. Слои dropout. Набор данных Fasion-MNIST.
Создание и обучение модели в PyTorch.
- Обработка естественного языка
Задачи NLP. Генерация слов. Посимвольная генерация. Биграммная модель.
Оценка качества модели с помощью отрицательного логарифмического правдоподобия. Регуляризация.
Эмбеддинг. Простая нейронная сеть. Понятие о рекуррентных нейронных сетях.
Модель Seq2seq. Механизм внимания (attention), self-attention.
Трансформеры.
Избранные материалы по машинному обучению и искусственному интеллекту
Количество материалов по МО и ИИ в последние годы растёт с катастрофической скоростью.
В приведённый ниже список ресурсов вошли только те, которые автор может однозначно
рекомендовать как очень качественные с его субъективной точки зрения.
Материалы на английском языке:
|
|