Линейная регрессия простыми словами

Линейная регрессия - это способ отобразить и описать форму зависимости между двумя обьектами.

Представьте y зависит от x, причём изменения в y вызываются именно изменениями в x. Так вот линейной регрессией для этого случая будет описание соотношения(прямолинейного) между этими двумя переменными.

Это соотношение описывают в формулах, добавляя коэфициенты, которые представляют собой величину, на конотурю объект Y увеличивается в среднем, если увеличивается объект X на одну единицу.
В результате мы можем составить формулу, по которой можно предсказывать поведение объекта Y относительно изменений в объекте X:

Математическое уравнение, которое оценивает линию линейной регрессии:

Y=a+bx.
  • – называется независимой переменной или предиктором. 
  • Y – зависимая переменная или переменная отклика. Это значение, которое мы ожидаем для y (в среднем), если мы знаем величину x, т.е. это «предсказанное значение y»
  • a – свободный член (пересечение) линии оценки; это значение Y, когда x=0
  • b – угловой коэффициент или градиент оценённой линии; она представляет собой величину, на которую Y увеличивается в среднем, если мы увеличиваем x на одну единицу.
a и b называют коэффициентами регрессии оценённой линии, хотя этот термин часто используюттолько для b.

Полезные ссылки:

Линейная регрессия - Wiki

Коментарі

Популярні дописи з цього блогу

Минимальные требование для кластера Hadoop(with Spark)

Apache Spark - основные команды