Реши
Creado el: 27 de junio de 2026
Creado el: 27 de junio de 2026
Реши
Переобучение (Overfitting) — модель слишком хорошо запоминает обучающие данные, включая шум, поэтому показывает высокую точность на обучающей выборке и низкую — на новых данных.
Недообучение (Underfitting) — модель слишком простая и не может уловить закономерности данных, поэтому плохо работает как на обучающей, так и на тестовой выборке.
Энтропия — мера неопределённости (неоднородности) данных.
Для множества с классами:
где — вероятность класса.
Энтропия используется при построении деревьев решений (ID3, C4.5): выбирается признак, который сильнее всего уменьшает энтропию (максимальный информационный выигрыш).
Дано:
| Стаж , лет | 1 | 3 | 5 | 7 | 9 |
|---|---|---|---|---|---|
| Зарплата , тыс. руб. | 30 | 45 | 55 | 65 | 80 |
Точки:
Они располагаются почти на одной возрастающей прямой.
Средние значения:
Вычислим таблицу:
| Произведение | ||
|---|---|---|
| -4 | -25 | 100 |
| -2 | -10 | 20 |
| 0 | 0 | 0 |
| 2 | 10 | 20 |
| 4 | 25 | 100 |
Также
Тогда
Это означает очень сильную положительную линейную связь между стажем и зарплатой.
Уравнение:
Наклон:
Свободный член:
Следовательно,
Коэффициент наклона равен
Это означает, что каждый дополнительный год стажа увеличивает ожидаемую зарплату примерно на 6 тыс. рублей.
Свободный член 25 тыс. руб. — теоретическая зарплата при нулевом стаже.
График надо?
Да, по условию задачи график нужен.
В билете прямо написано:
«Постройте диаграмму рассеяния».
Достаточно нарисовать систему координат и отметить пять точек:
На экзамене можно просто от руки поставить эти точки. Линию проводить не обязательно, так как просят именно диаграмму рассеяния (если преподаватель не просит дополнительно изобразить линию регрессии).
Сделвй
Вот готовая диаграмма рассеяния, которую можно срисовать в тетрадь.
textЗарплата (тыс. руб.) 80 | ● 75 | 70 | 65 | ● 60 | 55 | ● 50 | 45 | ● 40 | 35 | 30 | ● +--------------------------------------> Стаж (лет) 1 3 5 7 9
Точки:
На экзамене этого графика будет достаточно. Если хотите оформить ещё лучше, можно провести через точки пунктирную линию, показывающую общий возрастающий тренд.