PGR21.com
- 경험기, 프리뷰, 리뷰, 기록 분석, 패치 노트 등을 올리실 수 있습니다.
Date 2019/11/01 11:34:10
Name 공실이
Link #1 https://deepmind.com/blog/article/AlphaStar-Grandmaster-level-in-StarCraft-II-using-multi-agent-reinforcement-learning?fbclid=IwAR0GiuNw-1w9StMGUIaE02NijJdjoSffNHg7guh_W0KE5LR-kI_MHrUpvNw
Subject [스타2] 딥마인드의 알파스타가 인간과 비슷한 조건에서 그랜드마스터를 달성했습니다. (수정됨)
자게로 갈까 겜게로 갈까 고민하다가 게임게시판에 적습니다.
어제자(10-30)로 따끈따끈한 알파고 관련 소식입니다. 딥마인드가 직접 결과를 정리하는 포스팅을 했습니다.

출처 : https://deepmind.com/blog/article/AlphaStar-Grandmaster-level-in-StarCraft-II-using-multi-agent-reinforcement-learning?fbclid=IwAR0GiuNw-1w9StMGUIaE02NijJdjoSffNHg7guh_W0KE5LR-kI_MHrUpvNw


요약

고맙게도 4가지로 요약을 해줬는데 영알못이지만 구글번역기의 도움을 받아 옮겨봅니다.

1. 알파스타는 이제 인간과 같은 플레이 제약조건을 받습니다. 카메라를 통해서 세상을 봄 (아마 사람 화면과 같은 범위를 본다는것 같습니다.), 훨씬 심한 EAPM 제약조건 (5초당 22번의 최대 명령)

2. 알파스타는 이제 1대1 매치에서 모든종족을 플레이 하고 모든 종족을 상대할 수 있습니다. 각 프로토스, 저그, 테란 플레이는 각각 하나의 단일 신경망으로 되어있습니다. (논문 기준으로 마지막 알파스타의 MMR은 세 종족 다 비슷비슷 했지만... 프>테>저 였습니다. 6275, 6048, 5835)

3. 리그에서의 훈련은 완전 자동화 되어있으며, 이전 실험에서 trained-모델로 훈련을 시작했던것과 다르게, supervised learning (지도학습) 으로만 훈련을 시작합니다. (요 부분이 뭔소린지 잘 모르겠네요)

4. AlphaStar는 공식 게임 서버 Battle.net 에서 인간 플레이어와 동일한 맵과 조건을 사용하여 플레이 했습니다. 모든 게임 리플레이는 여기 (https://deepmind.com/research/open-source/alphastar-resources) 에서 확인가능 합니다



“AlphaStar의 게임 플레이가 엄청나게 인상적이라는 것을 알았습니다.이 시스템은 전략적 위치를 평가하는 데 능숙하며 상대방과 언제 교전하거나 이탈해야하는지 정확히 알고 있습니다. AlphaStar는 훌륭하고 정밀한 제어 기능을 제공하지만, 인간이 이론적으로 달성 할 수없는 수준이 아닌 초 인간적인 느낌은 없습니다. 전반적으로 스타 크래프트의 '실제'게임을하는 것처럼 매우 공평합니다. - DARIO “TLO” WÜNSCH, 스타2 프로게이머 (구글번역)



어떻게 했나?

관련 논문을 네이처에 (https://www.nature.com/articles/s41586-019-1724-z.epdf?author_access_token=lZH3nqPYtWJXfDA10W0CNNRgN0jAjWel9jnR3ZoTv0PSZcPzJFGNAZhOlk4deBCKzKm70KfinloafEF1bCCXL6IIHHgKaDkaTkBcTEv7aT-wqDoG1VeO9-wO3GEoAMF9bAOt7mJ0RWQnRVMbyfgH9A%3D%3D) 발표하였네요. 아직 저도 못읽어봤지만 ㅠㅠ 시간이 나면 천천히 해설하는글도 한번 적어보면 좋겠습니다…



팀별 훈련!

블로그 글에 의하면, 처음에는 지도학습으로 훈련을 시작해서 대강의 전략을 익힌뒤에, 알파고처럼 자기 스스로 하는 대결(self-play)를 계속 반복하여, 많은 실력을 향상시켰다고 하네요. 원래 자기플레이를 하다보면 올챙이적 플레이를 잊어버림으로써 옛날전략에 당해버리는 결과를 가져올 수 있는데, 이러면 옛날전략을 이기는 전략으로 다시 학습 되는 바람에 실력은 향상되지 않고 전략만 가위-바위-보 로 돌고도는 문제에 빠진다고 합니다. 딥마인드가 이야기 하는 알파스타의 발달한 점은, “fictitious self-play” 라는 옛날 전략을 완전 없애지 않고 섞어두고, 더 나아가서, 이런 알파스타들을 그룹으로 묶어서 그룹전체의 실력이 향상되도록, 파트너의 결점을 부각시켜서 그 결점을 해결할 수 있도록 돕는 방식을 구현했다고 하는데, 프로팀들이 팀내 연습을 하면서 장단점을 발견하는걸 떠올리게 하네요.



지도학습 이후에 self-play

또 재밌는 점은 첫 모델에 스스로 학습한것을 쓰지 않고, 사람의 플레이를 이용해서 배우게 하고 어느정도 실력이 올라간 이후에 자기학습을 사용한 점입니다. 스타크래프트의 경우에는 경우의 수 가 너무 많아서 (1 time step 당 10^26 가지 가능한 행동), 경우의 수를 각 단계별로 수천가지 정도로 줄여주는 과정이 필요했다고 합니다. 그래서 알파고 (Alpha zero) 처럼 무에서 출발하지 않고, 사람이 플레이하는 과정을 어느정도 흉내내서 다이아 티어정도의 실력을 만든 뒤에 self-play를 적용했다고 합니다.



얍삽이 (exploiter) 대처는?

공개한 동영상중에 재밌는게 있는데, 일명 exploiter (얍삽이? 사기전략?) 를 알파스타가 어떻게 해결하는가 입니다.

초반에 캐논러시에 겁나게 당하다가, 다른 알파스타 중에 하나가 캐논러시를 일꾼을 동원해서 막으면 된다는걸 학습합니다(!). 또 하나는 컨+조합이 합쳐진 짜내기 한방같은 사기빌드가 중간에 나왔는데, 이 전략이 다크에 약하다는것을 하나의 알파스타가 발견해서 막게됩니다. 프로팀마다 알파스타 하나씩 있으면 코치들이 알파스타 훈련하는것 보면서 꿀빌드 찾아내는 장면이 떠오르네요.

“AlphaStar는 흥미롭고 정통적인 플레이어입니다. 최고의 프로의 리플렉스와 속도는 있지만 전략과 스타일은 전적으로 고유합니다. 에이전트가 리그에서 서로 경쟁하는 AlphaStar의 훈련 방식은 상상할 수 없을 정도로 특이한 게임 플레이로 이어졌습니다. 스타 크래프트의 다양한 가능성을 프로 선수들이 실제로 얼마나 탐구했는지에 대한 의문을 갖게합니다.” - DIEGO "KELAZHUR"SCHWIMER, 스타2 프로게이머(구글 번역)



실버부터 그마까지!

아래 동영상에 전체적으로 알파스타의 실력이 향상되는 과정이 나옵니다. 처음 부터 실버를 달성했다는… 그럼 브론즈는 뭐가되냐는…


프로들이 보기에 아직 좀 결점이 있어보인다고는 하는데, 또 붙어보면 모를일 아니겠습니까, 또 향상속도를 보면 왠지 더 올라갈 가능성도 있어보이고… 어쨌든 인간의 손속도로, 인간 화면기준으로 이정도 능력을 달성했다는게 정말 놀랍네요.

오역 및 제가 잘못이해한 부분 있으면 댓글로 지적 부탁드립니다. 읽어주셔서 감사합니다.


통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
빙짬뽕
19/11/01 11:38
수정 아이콘
열심히 게임하면서 논문도 내는 분야가 있다...?
HA클러스터
19/11/01 11:40
수정 아이콘
APM 얼마로 주고 했는지도 공개됬나요?
스위치 메이커
19/11/01 11:42
수정 아이콘
5초당 22번이면 264인 것 같네요
공실이
19/11/01 11:43
수정 아이콘
5초당 22번 명령수로 최대 제한을 뒀다고 하고 (카메라 무빙 포함), 평균 EAPM은 200정도로 나왔다고 하네요.
HA클러스터
19/11/01 11:44
수정 아이콘
다들 알려주셔서 감사합니다.
페스티
19/11/01 11:46
수정 아이콘
인간시대의 끝이..
Lazymind
19/11/01 11:57
수정 아이콘
스타를 끝으로 다른게임은 안할거같은데 알파롤 한번 해주면 안되겠니..
알파롤5대 vs 각라인올스타 붙여보고싶은데
RedDragon
19/11/01 12:00
수정 아이콘
알파롤 압승 아닐까요 롤에 APM이 많이 필요한것도 아니라서...
SkyClouD
19/11/01 12:01
수정 아이콘
롤의 논타겟 기술은 대부분 '인간 만' 눈으로 보고 못피합니다.
알파롤이면 죄다 피해버릴 수 있어요. 애초에 지금 있는 닷지 핵들도 그래픽 인식으로 닷지하게 되어 있어서.
게다가 알파롤은 cs 수급에서 이미 인간보다 압도적으로 우위에 있을거라... 초기 버전도 최소 마스터 봅니다.
초록물고기
19/11/05 09:57
수정 아이콘
예전에 알파스타에 대해서 알파스타는 다크나 옵저버의 울렁거림을 놓치지 않을 것이다 라고 했는데, 유튜브를 보니 (언제 버전인지는 모르겠으나) 알파스타가 의외로 다크를 놓치더라구요. 어떤 원리인지 저도 궁금하긴 합니다.
19/11/01 12:09
수정 아이콘
초기버전은 몰라도 어느정도 데이터가 쌓이면 인간이 이기기가 너무 힘듭니다

논타겟 적중률이나 CS 수급도 문제고, 강타쌈을 100% 지는데 오브젝트 컨트롤도 너무 힘들고...운영으로 너무 큰 손해만 안보는 경지까지만 올라가면 피지컬과 한타력으로 압승하는 구도가 나올 것 같네요
치토스
19/11/01 12:29
수정 아이콘
피지컬이 헬퍼인데 뇌지컬도 있는 헬퍼면 인간이 절대 못이기죠
19/11/01 12:47
수정 아이콘
도타에서 이미 비슷하게 했었을걸요 모든판결과가 기억안나지만 픽풀이 제한된 상태로 경기진행했지만 마지막팀전은 ai쪽이 이긴걸로알아요
고무장이
19/11/01 12:53
수정 아이콘
저도 알파롤이 매우 궁금합니다
사람이랑 붙여 보는거보다 자기들끼리 수억판하면서 짜는 최적화 조합이 어떨지가 매우 궁금해요.
EU 조합이 무너질지도 궁금하고요 생각만해도 결과가 너무 재미있을꺼 같아요.
19/11/01 13:16
수정 아이콘
인간하고 게임에 대한 개념이 달라서 별 도움은 안될겁니다. 가장 큰 문제는 논타겟 적중률로 높은 스킬은 한없이 높고 낮은건 한없이 낮게 나올 가능성이 높고

지금 롤은 인간 기준으로 밸런스가 맞춰져있는거라 인간이 수행 할 수 없는 기준으로 게임을 할테니까요
고무장이
19/11/01 14:04
수정 아이콘
도움이 되고 안되고를 떠나서 한다는 것 자체로도 궁금합니다
인간이 수행할 수 없는 기준이더라도 그것 나름대로 재미있을 것 같아서요

또 논타겟 적중률 같은 경우는 임의의 반응속도를 랜덤하게 설정하는 방식도 있을테고
지금처럼 기계처럼 맞추고 피하더라도 그 와중에 어떤 방식으로 플레이 할지도 궁금하고요
문문문무
19/11/03 09:35
수정 아이콘
인간과 비슷한 수준의 제한을 두는 방법론만 발전한다면 인간이 이해할수있는 개념으로 새로운길 제시할법하다고 생각합니다.

당장스2만해도 저정도면 거의 인간이 이해하고 플레이할수있는 개념과 플레이환경이라고 생각해요
19/11/01 12:54
수정 아이콘
일정이상 발전하면 노데스겜도 나올듯..
19/11/01 13:20
수정 아이콘
지들끼리 탓하기 시작합니다
19/11/01 13:52
수정 아이콘
스타는 최소한 '때리면 맞는 구조의 게임이지만'

롤은 논타겟을 맞추고 피하고.. 자체가 밸런스에 너무 큰 영향을 주게 되있는 구조라서..

두뇌가 중요한게 아니라 '맞추고 / 못맞추고' 의 지분이 너무 크다보니 의미가 없습니다.
비오는풍경
19/11/01 15:17
수정 아이콘
부정적인 의견이 많은데 저는 의외로 해볼만한 과제라고 생각합니다.
롤만 논타겟 있는 것도 아니고 스타2도 마이크로 컨트롤이 필요한 부분이 많습니다.
논타겟 피하는 메커니즘을 얘기해보면 롤파고가 만들어진다면 우리가 논타겟 스킬 피하는 거랑 별 다를게 없는 방식으로 피할 겁니다.
다른 여타의 동작도 마찬가지구요. 문제는 그 여러 가지 동작을 적당한 때에 적당한 순서로 해야 한다는 거죠.
라인전만 생각해봐도 CS 먹으면서 상대 스킬 피하고 핑 보고 핑 찍고 이런 동작들을 한꺼번에 하잖아요?
스2도 경우의 수가 너무 많아서 지도 학습을 거치고 본격적인 학습을 시작했는데 롤은 그 양이 훨씬 많을 겁니다.

아마도 헬퍼 때문에 부정적인 의견이 많은거 같은데 헬퍼는 스킬이 어디로 발사된다는 정보를 이미 아는 상태에서 피하는 거고
이런 인공지능이 얻는 정보는 우리가 얻는 정보와 크게 다르지 않아서 헬퍼와 같은 원리로 동작하지는 않을 겁니다.

이건 게임 내에서의 경우에 대해서만 얘기한 겁니다.
밴픽에 대한 인공지능 도입하려면 아마 인공지능 하나를 따로 만들어야 할거임...
머나먼조상
19/11/01 15:47
수정 아이콘
이미 도타에서 세계 최고의 팀을 이겨서 굳이 하려는 연구소가 있을지 모르겠네요
영웅 숫자 제한 빡세게 넣어서 픽밴은 판단이 안되지만 한타 합이 예술이라고 합니다
문문문무
19/11/03 09:41
수정 아이콘
엄밀히 말하면 [전]세계 최고 팀이고 온라인으로 누구나 팀짜서 붙어볼수있도록 풀린뒤 며칠간은 압도적 승률이 나왔지만 점점 파훼법이 등장하면서 준프로나 아마 초고수팀들 수준대에서 번번히 격파당했었습니다

거기서 상대한 팀의 반응들이 피지컬빨이 아직 강하다, 모바게임의 개념을 심도깊게 파악한것 같진않다 였었죠

더 연구해볼 가치거 충분히 있다고 봅니다
카바라스
19/11/01 17:04
수정 아이콘
소위 실수라고 할수 있는 요소가 다인게임으로 갈수록 늘어서.. 피지컬이 동일하다해도 상대가 안된다고봐요.
19/11/01 17:14
수정 아이콘
1인 게임이 아니잖아요.

'5명이 하나의 생각'을 한다는거 자체가 이미 반칙이죠.
은하관제
19/11/01 12:02
수정 아이콘
2019 블리즈컨 스타2 결승전이 끝나고, 갑자기 그랜드파이널이란 메시지가 뜨며 '알파스타'라는 닉네임이 화면애 뜨는데...
화려비나
19/11/01 13:09
수정 아이콘
(수정됨) 그랜드파일날(G.P.)이란 말입니다ㅠㅠ
잉여레벨만렙
19/11/01 12:11
수정 아이콘
향상 속도 보니 조만간 인간 상대로 매치업 나오겠네요. 스2의 이세돌은 누가 될지... 보통 매치업이 잡히면 그건 알파스타가 무조건 이긴다는 것인데, 그래도 기적이 한 번쯤은 나오겠죠?
시간이지나면
19/11/01 17:37
수정 아이콘
현재기준이면 세랄이 되지 않을까 싶네요
표저가
19/11/01 12:12
수정 아이콘
대단하네요 와..
이정재
19/11/01 12:18
수정 아이콘
(수정됨) 생각보다 엄청오래걸렸네요 몇달전 실력도 몇경기는 단순그마레벨이 아니었는데
다빈치
19/11/01 12:21
수정 아이콘
근데 EAPM제한이 260이면 엄청 높은거긴 한데 생산할때 생각하면 그 정도는 필요한거 같기도 하고 크크
공실이
19/11/01 12:24
수정 아이콘
논문에 보니까 EAPM분포도 나와있는데, 평균손속, 최대손속 둘다 상대방 인간쪽 통계가 더 높았습니다.
신예은팬
19/11/01 12:40
수정 아이콘
(수정됨) 아직 세랄한테는 진다는 거 같던데. 8월에 한 거 말고 최근에도 세랄이 이겼다고 들었는데 모르겠네요

래더 아이디나 랭킹이 몇위일지 궁금하네요
이정재
19/11/01 12:48
수정 아이콘
mmr저정도면 세랄한테 지죠 저그 mmr도 제일 낮고...
카스가 아유무
19/11/01 12:52
수정 아이콘
mmr6200정도면 아직 상위레벨의 프로게이머에 못미칩니다. 세랄은 mmr이 7천이 넘어가는데 세랄 이기려면 아직 더 학습을 해야하지 않을까 싶네요
가루맨
19/11/01 13:40
수정 아이콘
참고로 말씀드리면 세랄은 가장 낮을 때도 유럽 서버 MMR 7200 이상이고 높을 때는 7400 넘죠.
암드맨
19/11/01 12:48
수정 아이콘
오우 이젠 좀 공정한 게임이되겠네요.
6000점이면 한국 기준 초고수아마~프로초입 정도에 왔네요.
암드맨
19/11/01 12:49
수정 아이콘
켈라주르 인터뷰 보니깐 이번버전은 꼭 시연 보고 싶네요.
19/11/01 13:05
수정 아이콘
이제 인간형 로봇이 나와서 직접 마우스 잡고 플레이하는 걸로 합시다.

빡치면 샷건도 치겠죠?
천원돌파그렌라간
19/11/01 18:14
수정 아이콘
샷건을 쏠지도?
타카이
19/11/02 09:06
수정 아이콘
익스털미네이트!
19/11/01 13:08
수정 아이콘
세랄이 역대 최강이긴 한데 벌써 mmr 6000대면 세랄도 얼마 안 남았겠네요.
졸린 꿈
19/11/01 13:20
수정 아이콘
알파스타 경기 영상보면 항상 프로토스밖에 없네요.
앞으로 악질 토스유저분들이 징징대면 알파스타를 내밀고 턴을 종료해야되겠습니다. 크크
다크템플러
19/11/01 13:41
수정 아이콘
알파롤 나오면 굉장히 높은확률로 칼15서렌 나오지않을까요 크크크
고양이왕
19/11/01 13:50
수정 아이콘
대딘한 기술력이네요 저 기술력이 정치계나 의료계에 방영되서 사람들의 삶의 질이 높아졌으면 좋겠습니다
19/11/01 13:56
수정 아이콘
정치나 의료는 시뮬레이션과 실전이 별개라서 AI의 학습이 안먹혀서 의미가 없죠
고양이왕
19/11/01 13:59
수정 아이콘
전문가신가봐요? 대중매체를 통해 접한 정보에 의하면 ai 개발의 종국적인 목표가 의료 기술 도입이라고 알고 있었는데 요즘은 또 아닌가봐요?
꼭두서니색
19/11/01 14:38
수정 아이콘
IBM의 왓슨 등 의료분야에서 활용하기 위한 AI가 개발되고 실제 필드에서도 쓰이고 있지만, 아직은 그 효용성에 있어 의문점이 더 큰 것은 사실입니다.
넘어야 할 벽이 너무 높긴 한데 그걸 감안하더라도 아직은 의미있는 수준의 유용성을 입증하지 못 하고 있습니다. 물론 계속 개선한다고는 합니다만..
고양이왕
19/11/01 15:01
수정 아이콘
그렇군요 딥블루가 나온지 수십년이 됐는데 아직 갈길이 먼 걸 보면 ai기술의 발전은 꽤나 어렵나봅니다
꼭두서니색
19/11/01 15:18
수정 아이콘
기술적인 문제도 있지만 개인적으로 생각하는 가장 큰 벽은 기존 데이터가 AI가 잘 써먹을 수 있는 형태로 정리되어 있지 않다는 겁니다.
의료 AI의 경우 이 문제 때문에 환자 데이터가 방대하게 누적되어 있다고 하더라도 이걸 분석하고 학습하는게 매우 어려워지고, 새로운 환자의 몸상태를 기존 환자 데이터와 비교하는 것 또한 어려워집니다. 이게 안 되니 유의미한 수준의 신뢰도높은 치료방안 제시 성능이 많이 떨어지게 되구요.
이걸 해결하려면 빅데이터를 AI에 맞게 새로이 재구성함과 동시에 AI에 판단을 내리는 데 필요한 충분한 양의 '정제된' 데이터가 필요해지는데 데이터를 수집, 정리하는 방식은 의사 또는 병원마다 제각각이니.. 여기서 막히는 경우가 많습니다.
고양이왕
19/11/01 15:20
수정 아이콘
또 다른 한계점은 없나요 궁금합니다
꼭두서니색
19/11/01 15:59
수정 아이콘
댓글로 다 쓰기엔 너무 많아서 짧게 정리해보면 + 의료AI에 한정해보면 (정치는 제가 모릅니다)
1. 100명의 환자가 있으면 100종류의 증상 설명과 100종류의 진단과 100종의 처방과.. 하는 식으로 단답형으로 딱 잘라 라벨링하고 데이터를 정리하는 것이 사실상 불가능합니다. 정형화가 안 된다는 거고, 결국 서술형으로 이런 정보들을 정리할텐데 이렇게 되면 AI가 가장 먼저 만나는 과제는 '자연어 처리'가 됩니다.
사람이 쓰는 말을 AI가 이해할 수 있어야 한다는 거죠. AI 맞춤형이 아니라요. 차트를 보고 이해할 수 있어야 처방을 하든 뭘 하든 할 수 있는건데..
이 자연어 처리 성능이 개선됐다고는 하나 여전히 유용한 수준에는 턱없이 못 미치는 수준입니다. 이 떄문에 환자 차트에 쓰이는 의학 용어를 이해하는 성능이 떨어지게 되고 AI의 진단 정확도 역시 같이 떨어지게 됩니다.

2. 동종업계가 아예 없어서 의료AI가 잘 하고 있는건지를 판단할 분석 도구가 부족합니다. 연구되고 있는건 많지만 실제로 필드에서 쓰인건 딱 한 종류라고 알고 있습니다.
가장 직관적인 방법은 실제 의사의 진단과 AI의 진단을 비교해보는건데, 아직까지는 사람의 압승입니다.

3. 의료AI를 사용하는 목적 중 하나는 환자의 상태를 진찰한 의사가 찾아내기 어려우면서 치료에 크게 영향을 줄 수 있는 요소를 찾아내는 것입니다.
1번의 문제에서 파생되는 문제점이기도 한데, 자연어 처리 성능 부족으로 인해 이 부분 역시 거의..의미없는 수준입니다.

4. 의학은 잘 모르지만, 비슷한 질병을 가진 환자들에게서 나타나는 공통점을 찾고 분석하여 해당 질병에 대한 치료법을 정립하는게 선행되어야 한다고 알고 있습니다. 현 시점의 의료AI는 이러한 기능을 수행하지 못 하고, 이는 진단의 정확도를 떨어뜨림과 동시에 몇몇 예외적인 환자(그러나 치명적인)를 무시할 수 있는 가능성이 생기게 됩니다. 당연히 이러면 안 되겠죠..

5. 의료계는 보수집단(정치x)중에서도 매우 보수적인 집단이라고 합니다. 이 때문에 고작 컴퓨터따위가 어떻게 환자를 진단하겠다는 것이냐! 하는 의견이 많아 꽤나 비혐조적이라고 합니다.

6. 너무 절망편만 나열한 것 같아서 희망편 하나만 쓰고 마무리하겠습니다.
의료AI의 경우 매우 좁은 범위의 '잘 이해된' 분야에서는 성능이 매우 좋다고 평가되어 있습니다. 예를 들어 종양 전문의 수련을 위해서는 암 환자의 유전자 변이를 파악, 분석하는 과정이 필요한데, 사람이 하면 오래 걸리는 일을 AI는 수 분 내에 할 수 있어 사람이 해야 했을 노가다작업을(틀리면 큰일나는) 획기적으로 줄여줬다고 합니다.

절대 일하기 싫어서 댓글쓰고 있는건 아닙니다..
고양이왕
19/11/01 17:54
수정 아이콘
와... 정말 정성스러운 댓글에 크게 감동받앗습니다 많이 배웠습니다

감사합니다
19/11/01 15:18
수정 아이콘
전문가는 아닙니다만
스타/바둑은 실전을 얼마든지 반복하고 결과를 볼 수 있지만
정치/의료는 실전을 원하는대로 반복해볼 수가 없죠
아마 같은 AI라고 불리워도 용어 자체가 분리되어 있을듯요
코드읽는아조씨
19/11/01 16:11
수정 아이콘
뭐 저도 비전문가이긴 한데 강화 학습이 적용 가능한 분야랑 강화 학습이 적용 불가능한 분야의 차이가 점점 벌어지지 않을까 싶네요. 자율주행 같이 지도 학습이 주류가 되는 분야는 좀 과장하면 데이터 확보력 = 경쟁력이라고 광고하는 경우도 많더라고요.
오리너구리
19/11/01 13:51
수정 아이콘
롤의경우 반응속도 제한을 두면 인간 최상위 수준의 퍼포먼스를 구현할 수 있지 않을까요? 확률적으로 약간의 명령미스도 유도해서 실골수준의 피지컬 컴퓨터 다섯이 밴픽과 인게임 움직임만으로 프로잡는거 보고싶네요.
가루맨
19/11/01 13:51
수정 아이콘
알파스타는 유럽 서버에서만 활동한 거라 한국 서버에서보다 MMR이 300 ~ 350 정도 높게 나온다는 점도 감안해야 합니다.
한국 서버 기준으로 환산하면, 토스는 아마 초고수 레벨에서 중하위권 정도고 저그는 그마를 간신히 찍는 점수라고 보면 되겠네요.
파이몬
19/11/01 13:52
수정 아이콘
특이점은.. 왔다...
19/11/01 14:03
수정 아이콘
논문 보는데 영어실력의 벽에 부딪치네요... 누가 해설좀 해줬으면
롯데올해는다르다
19/11/01 14:12
수정 아이콘
mmr이 저 속도로 오르고 있는거면 한 1달만 있다 발표해도 인간을 압도한다고 말할 수 있는 거 아닌가요,,? 신기하네요
꼭두서니색
19/11/01 14:33
수정 아이콘
인간시대의 끝이.. 오고 있네요..
일하기 싫어 몸을 비틀면서 논문 보는 중인데 재밌습니다. 논문해설글을 써보고 싶어지네요..
19/11/01 14:55
수정 아이콘
이런 기술은
꼭 최상위 플레이를 목표로 하기보다
단순히 초보유저들 상대해주면서 연습시키는 용도로
도입되어도 엄청 유용할거같아요.
처음엔 잘 맞아주지만
일정이상 같은 팬턴으로 공격하면
ai도 학습해서 대처하고 또 살짝 변칙 섞으면 또 잘 당해주는식
드디어 롤이나 스타, 격겜 같은 어려운 대전게임도 초보자 친화적이 될 수 있지않을까요
19/11/01 18:20
수정 아이콘
와 이거 좋네요

난이도 조절 해서 말이죠. MMR 몇 수준이랑...

가령 스타1 같은 경우는 싱글플레이는 빌드 연습 외에는 의미가 없는 수준인데

유저풀은 고인물OF고인물이라 접근하기 쉽지 않은데

약간 예전 공방양민수준의 실력을 가진 알파스타랑 붙는다면 점차 실력 늘려가기도 좋을 것 같아요
traveldrum
19/11/01 15:21
수정 아이콘
클릭미스도 구현한 건지 궁금하네요.
클릭 미스나 헛동작이 없이 모두 유효한 움직임이면 250도 엄청난 손속도라고 생각해서...
19/11/01 15:29
수정 아이콘
클릭정확도는 FPS나 롤에 비하면 중요도는 떨어지긴 하니까요
중요한건 APM 등을 제한할 수 있는 요소로 뒀다는점인거 같고
일단 특이점을 넘어가면 APM을 낮추거나 클릭정확도를 낮추는 요소를 추가해서 학습속도를 비교해보고 하지 않을까요
APM50으로 그마되기 같은식으로
김오월
19/11/01 20:28
수정 아이콘
사실 eapm에도 헛손질이 상당히 많이 들어가 있는지라, 헛손질 없는 eapm 250은 인간의 영역이 아니긴하죠.
19/11/01 16:04
수정 아이콘
??? : 시스템가동. 준비완료. 인간시대의 끝이 도래했다.
에밀리아클라크
19/11/01 16:08
수정 아이콘
와.... 이런날이 오긴 하는군요
Ethereum
19/11/01 16:22
수정 아이콘
알파고도 인정하는 프사기네요
이정재
19/11/01 16:52
수정 아이콘
근데 블리즈컨은 왜
신류진
19/11/01 16:32
수정 아이콘
만약 기계전쟁이 실제로 일어난다면, 그 시작은 롤하다가 알파고끼리 남탓하기 시작하면서 부터일겁니다. 크크
Knightmare
19/11/01 17:31
수정 아이콘
무조건 탑파고와 정글파고가 제일 먼저 싸울듯..
Proactive
19/11/01 19:23
수정 아이콘
Chungul chai..
샤르미에티미
19/11/01 18:28
수정 아이콘
생각보다는 늦긴 하네요. 인공지능을 사기를 쳐서 만들지 않는 이상은(격투 게임에서 플레이어의 입력을 보고 대처하는 등의) 생각보다는 사람보다 잘 하게 만들기가 어렵군요.
本田 仁美
19/11/01 20:34
수정 아이콘
브론즈는 인간만의 영역
19/11/01 21:14
수정 아이콘
모든게임을 인간처럼, 인간 이상 할 수 있는 ai가 나오면 게임계의 대혁명이 일어나겠네요. 알파ai와 함께하는 크킹이라니 ㅗㅜㅑ 소리가 절로 나옴
19/11/02 00:22
수정 아이콘
롤도 롤파고 1개가 5인역활 하는게 아닌 각자
탑파고 미드파고 정글파고 원딜파고 서폿파고 5개의 롤파고를 도입해서 각자 학습하다보면 사람이랑 다른 유형의
움직임이 나오지 않을까요

예를 들어 미드라이즈가 정글 첫블루를 강탈하고 선2렙
라인푸쉬하면서 정글과 서폿 미드 3명이 바로 카정을 간다던지...솔랭에서는 나안함 수고 하고 정글이 나가겠지만;;;
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
66944 [LOL] 역체탑을 눈앞에 두고 굴러떨어진 더샤이. 그의 치명적인 실수. [90] 랜슬롯16973 19/11/03 16973 3
66943 [스타1] KSL 셋팅 문제 관련 송병구 선수 의견 [16] 빵pro점쟁이14141 19/11/03 14141 0
66942 [LOL] 기적의 팀 펀플러스 피닉스 [117] 신불해22224 19/11/03 22224 70
66941 [스타2] WCS Zerg Finals [12] 묻고 더블로 가!11555 19/11/02 11555 1
66940 [LOL] SKT vs G2. 일반적인 인식과 다른 포인트들이 있다면? [34] 민트밍크13188 19/11/02 13188 0
66939 [LOL] ESPN : 페이커와 페이커 아버지의 인터뷰. [7] 삭제됨14602 19/11/02 14602 14
66938 [기타] 디아블로4 트레일러를 보고 난 후 스토리 예측 [27] 미카엘12087 19/11/02 12087 0
66937 [LOL] 라이엇이 시청시간대를 배려할 수 밖에 없는 이유 [19] Leeka11690 19/11/02 11690 5
66936 [기타] [와우] 복귀한 느낌과... 새로 변경될 렙업방식! [52] 시원시원10172 19/11/02 10172 1
66935 [스타2] 2019 WCS 8강 이병렬 vs 김도우 5경기 꼭보세요 [5] 삭신9951 19/11/02 9951 1
66934 [LOL] 해외팀들의 대재앙 SKT [63] 니시노 나나세15202 19/11/02 15202 10
66933 [기타] 2019 블리즈컨 - 블리자드, 기사회생 할 수 있을까? [59] 제라그17236 19/11/02 17236 2
66932 [LOL] 롤드컵 텀 사이에 컨텐츠가 정말 없었나? [33] Leeka11311 19/11/02 11311 8
66931 [LOL] 기묘한 노력가 퍽즈 [26] roqur11118 19/11/01 11118 1
66930 [LOL] 일본 롤은 룬 이름 번역을 뭐라고 했을까 궁금해 찾아 보았습니다 [13] 여기13907 19/11/01 13907 2
66929 [LOL] 리그 4,5위 팀들끼리 국제대회도 재밌을 것 같아요 [62] 구리트33310196 19/11/01 10196 3
66928 [LOL] 개인적으론 우르프 모드는 랜덤이 더 좋네요 [40] 초동역학11416 19/11/01 11416 3
66927 [스타2] 딥마인드의 알파스타가 인간과 비슷한 조건에서 그랜드마스터를 달성했습니다. [78] 공실이17369 19/11/01 17369 15
66926 [LOL] 롤드컵. 토너먼트일정부터 심심해요.. [110] 파란무테13179 19/11/01 13179 7
66924 [기타] 리니지M 개인거래 대형사고 - 1억 5천만원 아이템 스틸 [165] 루덴스21440 19/10/31 21440 0
66923 [LOL] 씨맥의 어제자 방송들 요약 [72] Leeka20551 19/10/31 20551 5
66922 [LOL] 슬슬 스토브시즌이 달궈질 예정입니다. [140] 1등급 저지방 우유18568 19/10/31 18568 0
66921 [LOL] 소드 선수에 대한 과한 비난은 좀 자제해야 하지 않을까? 생각합니다. [44] 삭제됨12685 19/10/30 12685 0
목록 이전 다음
댓글

+ : 최근 6시간내에 달린 댓글
+ : 최근 12시간내에 달린 댓글
맨 위로