Машинное обучение

Как бы вы объяснили разницу между современным состоянием искусственных нейронных сетей и человеческим мозгом тому, кто ничего не знает об этой области?

Любит | Нелюбов | Ответы | Вид | 6412


Бен Ксавье дизайнер, производитель, предприниматель   
@ | Обновлено Right Now


Используемые механизмы:

Оценка Монте-Карло. Вы делаете оценку (то, что вы отслеживаете ее), ждете много временных шагов, а затем обновляете свою оценку, основываясь на том, каково было реальное вознаграждение.

Критерии соответствия. То же, что оценка Монте-Карло, за исключением расчета. Вам не нужно отслеживать все прошлые оценки, чтобы обновить их. Работает только для некоторого взвешивания будущих наград.

Самонастройки. Вместо того, чтобы обновлять свою оценку на основе полученных после ожидания всех временных шагов, охватываемых оценкой вознаграждения, вы обрезаете свою оценку, суммируя полученное вознаграждение с ожидаемым вознаграждением на данный момент.

Все это по существу контролируемые методы, которые учатся оценивать будущие награды.

| |



Онлайн-курс
«Квантовые технологии»
Один из самых трендовых курсов в сфере Цифровой экономики.