Eksperci firmy Google wyszkolili DeepMind system sztucznej inteligencji do pokonywania przeszkód w przestrzeni wirtualnej.
Aby nauczyć system nowej funkcjonalności zastosowano system nagród w postaci punktów. Stworzono wirtualny kurs parkour składający się z różnych przeszkód i ustawiono nagrody za pokonanie każdej przeszkody.
System działa tak aby najszybciej sztuczna inteligencja pokonała przeszkodę i ruszyła dalej do przodu. Na późniejszych etapach uczenia dodano również dodatkowe bonusy i kary za niepokonanie przeszkód.
Sztuczna inteligencja DeepMind stosuje system prób i błędów aby nauczyć się poruszać coraz szybciej. W trakcie nauki zauważono, że używa ona niestandardowych rozwiązań, aby ominąć przeszkody.
Źródło: popmech.ru |