chapter 9 오늘날의 로봇 레딩 대학의 인공두뇌학과는 연구 활동비로 많은 지원금을 받는다. 연구자문위원회, 통상산 업부 등의 영국 정부 부서, 유럽 공동체의 연구 프로그램, 그리고 외국의 산업체로부터 지원 되는 재정을 바탕으로 최신의 기술과 장비를 포함해 훌륭한 연구 환경을 보장받고 있다. 예를 들어 최근 수년 동안 영국 석유회사, 영국 가스, 영국 전기, 유니레버, 브리티쉬 텔레 컴, 소니, 영국 은행, 스미스클라인 비첨, 그리고 새치웰 제어 시스템 사로부터 지원을 받고 있다. 세계 굴지의 워크스테이션 생산 업체인 미국의 선 마이크로 시스템즈 사가 아마도 우 리의 가장 큰 후원자일 것이다. 우리가 수행한 대부분의 일은 새로운 이론을 만들고, 이를 모의로 실험한다든가 우리가 고안한 지능 제어법을 관련 회상을 위해 실제 문제에 적용하는 것이다. 정부든 산업체든 간 에 각 과제의 후원자들은 연구 방향에 상당한 관심을 갖고 있고, 따라서 어떠한 연구가 수 행되어야 하고 궁극적으로 어떠한 것이 이뤄져야 하는지에 대한 요구가 있기 마련이다. 즉 기대치에 부응해야 하는 것이다. 여기에는 약간의 융통성이 있을 수 있지만 그다지 많은 것 은 아니다. 지능 로봇과 관련된 과제들은 이와는 달리 우리과 내부에서 심사숙고하여 문제를 다룬다. 우리는 미래를 어느 정도 내다볼 수 있기 때문에 어떤 방향으로 연구해 나갈 것인지, 얼마 나 빨리 목적을 달성할 것인지, 그리고 연구 방향을 변경해야 하는지를 결정하는 것은 바로 우리들이다. 연구라는 것은 결과적으로 진취적이고 흥미로우며, 대단히 즐거운 일이기에 큰 난관을 극복할 때 짜릿한 흥분을 준다. 이 장에서 설명하겠지만, 실제로는 연구가 많은 자원을 필요로 하지 않음에도 불구하고 일을 지원하려면 지원 부서를 통해야만 한다. 우리에게 자산이 되는 것은 비싼 장비나 출처 가 불명확한 수표가 아니라 과제를 수행하면서 온 정열을 불사를 수 있는 능숙한 연구원들 이다. 그러한 이유로 일곱 난쟁이 로봇들의 설계 및 제작을 선두 지휘한 전임 강사 데이브 키팅에게 칭찬을 해주고 싶다. 우리는 정부나 산업체 등의 국방관련 부서의 지휘를 받지 않기 때문에 파괴나 전쟁을 위 한 기계를 제작하지 않는다. 다만 우리는 지능 로봇과 관련하여 현재는 무엇이 가능하고 미 래에는 무엇이 가능한지를 조사할 뿐이다. 그러는 동안 우리는 현재 진행중인 계획과 이 분 야에서 발전 가능한 것들을 알 수가 있다. 따라서 우리는 자신을 '좋은 사람들'로, 혹은 아마 도 더 적합하게는 지능 기계 분야에서 가능한 것과 불가능한 것을 솔직히 구분해 주는 '백 기사'라고 생각한다. 다음과 같은 다섯 가지 지침은 지능 기계에 대한 연구를 할 때에 상당히 그럴듯해 보인 다. 1.비싸고 가장 강력한 컴퓨터를 구입한다. 2.비싸고 가장 강력한 비디오 카메라를 구입한다. 3.비싼 접속 장치로 이 둘을 연결한다. 4.비디오 카메라로 전송된 그림으로 컴퓨터가 뭔가 하게 한다. 예를 들어. 나무와 목재 우 체통의 차이를 구별하게 한다. 5.컴퓨터의 계산 결과 - 예를 들어 '이것은 나무입니다' -를 이용하여 차를 조종한다든가 등의 일을 하게 한다. 그러나 이러한 접근 방법은 처해 있는 문제를 풀기 위해 실제로 필요한 것보다 항상 지나 치고, 쓸데없이 기계가 인간의 가치와 관심을 종종 조종하려고 한다는 것이 나의 견해이다. 예를 들어 컴퓨터를 이용하여 차가 어떤 물체 주변을 돌아다니게 하려고 한다면, 컴퓨터는 나무와 우체통의 차이를 알거나 이해할 필요가 없다. 단지 경로에 뭔가가 있다는 사실만 알 면 될 뿐이지 그 정체까지 알 필요는 없다. 비디오 카메라는 이를 위한 최선책일 수도 아닐 수도 있다. 아무 처리도 되지 않은 가시 영상은 컴퓨터가 처리 시간을 필요로 할 정도로 꽤 복잡하 다. 만약 차가 시속 100㎞로 움직여야 한다고 할 때, 차가 접근하고 있는 물체가 나무인지 우체통인지 판단하기 위해 25분이 걸린다면, 이러한 기판이 장착된 지능 시스템은 쓸모 없 는 것이 되고 만다. 이 경우 우리가 기대할 수 있는 것은 충돌한 지 24분 59초 후에 '25분 전에 나무에 충돌했습니다.'라는 응답이 고작이다. 물론 충돌 후에도 컴퓨터가 계속 동작하 고 있다면 말이다. 컴퓨터로 구동되는 차의 경우, '차량 전방에 물체가 있으니 돌아가든지 천천히 가야 합니 다'라는 문제를 컴퓨터가 빨리 판단하도록 하는 경우라면 훨씬 나아질까? 이 경우는 가시 영상을 사용하여 차량 전방의 물체 유무를 파악하고, 가능하다면 그 물체의 폭까지 알아내 는 것만으로도 충분하다. 곤충과 동물, 그리고 인간까지 포함한 생물학의 세계에서는 그들의 물리적 능력과 잠재력 이 크기와 복잡성 모두를 고려한 두뇌 능력의 정도와 균형을 이루면서 진화해 왔다. 그래서 유충의 두뇌는 비록 작지만 자신에게는 적합하다. 마찬가지로 개의 두뇌는 개에게, 인간의 두뇌는 인간에게 적합하다. 예를 들어 인간은 두뇌로 들어오는 3분의 2이상이 오직 시각 정 보에만 관계한다고 추정된다. 각 경우에 있어서 정신적·육체적 속성은 조화롭게 진화되어 왔다. 유충의 두뇌를 지닌 인간이라든가 반대로 인간의 두뇌를 지닌 유충의 예는 불균형이 얼마나 문제가 되는지를 상상하게 해준다. 우리의 지능 로봇에 대한 접근 방법은 이러한 균형을 염두하고 있다. 우리는 유효한 능력 과 각 로봇의 두뇌 용량에 각 로봇이 행해야 할 물리적인 역할이 조화를 이루도록 해왔으 며, 따라서 이를 위해 필요한 감각과도 조화를 이루도록 해왔다. 고작 한두 개의 간단한 작 업을 수행하고자 하는 곳에는 단순하고 비교적 작은 두뇌만으로도 충분하다. 레딩 대학에서 상당한 관심을 쏟고 있는 것들 중 하나가 총체적 지능이다. 꿀벌을 예로 들어 보자. 각각의 벌들은 수천 개의 뉴런으로 된 두뇌를 갖고 있다. 각 개체로서의 벌은 날 기, 먹이 주기, 자기 보호 뿐만 아니라 어떤 꽃에, 그리고 하루중 어느 때에 그 꽃에 날아가 야 하는지를 기억한다. 심지어 벌은 다른 벌들과 의사 소통이 가능해서 그 꽃이 어디에 있 는지를 알릴수 있다. 또한 벌들은 훌륭히 벌집을 짓고 꾸려 나갈 수 있다. 의사 소통을 통해 벌들 전체는 하나의 벌보다 영리해진다. 그러나 그들 두뇌의 전체 뉴런 수가 인간과 비슷할지라도 천만 마리의 벌떼 전체가 인간의 지능과 똑같을 거라고 생각되지 는 않는다. 분명히 의사 소통은 다른 차원을 얻게 해주지만 뉴런들이 각 벌의 머리에 확실 히 나누어져 있기 때문에, 천만 마리의 벌들이 갖고 있는 모든 뉴런간의 완벽하고 복잡한 연결은 있을 수 없다. 이것은 많은 사람들이 강연과 학습을 위해 모이는 것이 모든 사람들이 집에 있어서 서로 를 개의치 않는 경우보다 훨씬 긍정적인 효과를 가져오는 대학의 개념과도 비슷하다. 인류로서 우리는 오랜 역사를 거치면서 침팬지가 손뼉을 치는 등의 인간과 비슷한 행동을 할 때 상당히 놀라워하면서 동물을 우리 자신과 비교해 왔다. 우리는 파블로프의 개에 관한 실험 뿐만 아니라 곰이 춤을 추고, 사자가 연단에 선다든가 새가 사람의 소리를 내는 등 동 물이 우리가 지시한 대로 행동하도록 했고, 이로써 우리는 이들이 어느 정도 지능을 갖는다 고 판단했다. "레딩 대학교는 훌륭해"라고 말하는 새는 그렇지 못한 새보다 더 지능적인 것 이다. 우리는 인간이 갖고 있는 가치 등을 동물도 갖는다고 보고 그들이 우리를 좋아하거나, 좀 다르긴 하지만 인간과 비슷한 검정을 갖고 있다고 가정한다. 우리는 움직이거나 외부 환경 에 반응하는 기계들도 똑같다고 본다. 예를 들어 당신이 시동이 걸리지 않은 차에 타서 '자, ОО야, 시동 걸어!' 또는 '제발 시동 좀 걸어 다오. 나 지각할지도 몰라'라고 했다고 하자. 차가 그 말을 이해할 수 있을까? 우리가 인간의 가치나 이해를 바탕으로 동물이나 기계같은, 인간이 아닌 것에 대해 고려 할 때에는 유의해야 한다. 그러함에도 불구하고 인간은 종종 그러한 일을 벌인다. 나도 예외 가 아니다. 나 역시 결국 인간이기 때문이다. 앞으로 이 장에서는 로보틱스에 관한 연구 결 과로 로봇 자신들의 관점 뿐만 아니라, 기계의 행동 양식을 인간이나 동물과 어떻게 비교할 것인가 하는 인간의 가치 관점에 비추어 보고자 한다. 그 첫 번째 예로 일곱 난쟁이 로봇들의 1세대를 보자. 본래 이들은 프로그램된 장치에 불 과하다. 인간의 입장에서 본다면 이들은 기본적인 본능만을 갖고 있을 따름이며, 고장이나 전력 저하에 의한 경우를 제외하면 자신의 특성을 학습하거나 바꿀 수 없다. 이들이 감지하 는 정보는 전방 좌우 측에 물체의 유무이다. 기본적인 프로그램 형태는 자기 보호이다. 장애물이 전방 좌측에 있으면 로봇의 바퀴는 오른쪽으로 돌아가도록 조종된다. 전방 우측에 장애물이 있을 때에도 마찬가지다. 따라서 로 봇은 전방으로 움직일 수 있도록 프로그램 되어 있을 뿐만 아니라 회전할 수도 있어서 장애 물을 피할 수 있게 되어 있다. 이와 같은 본능은 어떠한 동물에서도 찾아볼 수 있으며, 곤충 에게서 가장 확실히 볼 수 있다. 나중에 파리를 손으로 잡으려할 때 어떻게 되는지 잘 살펴 보라. 그러나 이 로봇들은 다르게 프로그램 될 수도 있다. 한 가지 방법은 그들이 앞으로 움직 일 수 있게 하고, 물체가 나타나면 멈추게 하는 것이다. 물체가 멀어지면 다시 이를 따라가 면서 현재의 거리를 유지하며 앞으로 나갈 것이다. 일곱 난쟁이 로봇들을 일렬로 늘어 세우 면 재미있는 행동을 볼 수 있다. 움직이는 물체를 선두 로봇의 앞에 두면 로봇은 단순히 그 물체를 따라가고, 나머지 로봇들은 제각기 자신의 앞에 있는 로봇을 따라 가면서 줄지어 가 게 된다. 초음파 센서가 각 로봇의 머리 어느 한쪽에 놓여 있기 때문에, 바로 앞에 있는 로 봇을 따라가다 보면 조금씩 한쪽으로 움직이는 경향이 있다. 일곱 난쟁이의 행동을 살펴보면 엄마 오리를 선두로 해서 바로 앞의 새끼 오리를 따라 뒤 뚱뒤뚱 걷는 행동과 비슷하다. 새끼 오리들이 이처럼 행동한다는 것은 그들이 꽤 영리하다 는 것을 뜻하지만, 로봇에게는 몇 줄밖에 안 되는 프로그램으로도 구현 가능한 간단하고도 기본적 본능이다. 새끼 오리들은 태어나자마자 처음 본 것을 따라간다고 한다. 그러나 로봇 의 경우는 심지어 불가능할 정도의 먼 여행이 될 수 있는 벽도 따라갈 것이다. 적당한 거리인 로봇 전방 약 30㎝정도 앞에 물체가 있는 경우를 제외하고는 로봇이 그 자 리에 머물러 있도록 프로그램을 확장할 수도 있다. 이제 그 물체가 움직이면 로봇은 물체와 계속 같은 거리를 유지할 것이다. 물체가 가까이 다가오면 로봇도 안전한 거리만큼 뒤로 물러날 것이다. 이 경우 '물체'는 걷는 사람이 될 수도 있다. 로봇은 짧은 거리를 유지하면서 사람의 뒤를 따라다닌다. 사람이 로봇 쪽으로 가면 로봇은 뒤로 움직일 것이다. 프로그램 된 로봇의 이같은 간단한 동작은 사람의 발 뒤를 졸졸 따라 다니는 개, 특히 강 아지의 행동과 매우 유사하다. 이러한 행동은 강아지가 얼마나 영리한지를 알려주기도 하지 만, 로봇에게는 한두 줄의 프로그램 코드에 지나지 않는다. 간단히 말해, 우리가 적절히 보 상해줄 수 있는 한, 이러한 행동은 로봇에 의해 쉽게 학습될 수 있다. 사실 이 한 가지 경우만 보고서 개의 행동이 영리하거나 지능적이라고 판단한다면, 로봇 의 똑같은 행동에 대해서도 그렇다고 말하지 않을 수 없게 된다. 우리는 이런 행동을 하는 기계나 개의 지능에 관한 판단을 내리고 있다. 이것은 인간과 기계의 지능을 비교하려고 할 때 야기되는 문제와 똑같다. 일곱 난쟁이의 1세대가 할 수 있는 것들은 육각 로봇인 월터도(비록 걷는 것이긴 하지만) 할 수 있다. 월터는 애완용 개나 바퀴벌레처럼 사람을 졸졸 따라다닐 수 있다. 하지만 월터 는 바퀴벌레나 일곱 난쟁이들보다는 다소 느려서 앞서가는 사람이 아주 천천히 걸어야 한 다. 월터가 일곱 난쟁이들과 함께 울타리에 갇힐 경우 일곱 난쟁이들은 서로 부딪히지 않으 려고 애쓰는데 반해, 월터는 재빨리 움직이는 일곱 난쟁이에 둘러싸여 서서히 울타리의 한 쪽에서 다른 쪽으로 이동한다. 일곱 난쟁이들은 외부 환경에 반응하여 바퀴로 간단히 이동하며, 이 바퀴들은 각기 다른 속력으로 전후로 구동할 수 있다. 한편 월터는 또 다른 이동 수단인 다리를 갖고 있다. 월터 가 그 주변에서 어떤 일이 일어나는지에 따라 걸을 수 있도록 프로그램하는 것은 간단한 연 습 문제 수준이다. 월터는 뒤나 좌우로 이동이 가능할 뿐만 아니라 외부의 조건이 변화함에 따라 다리를 재배치할 수도 있다. 일곱 난쟁이들 중 일부는 이외에도 많은 특성들이 있다. 사실 이 특성들은 남에게 보일 목적이로는 잘 포함시키지 않지만, 필요하다면 다음 세대에서 갖추게 할 수도 있다. 이러한 반응들 중 첫 번째 형태는 약탈자와 피약탈자이다. 로봇에는 일반적인 장비뿐 아 니라 적외선 수신기가 장착되고, 서로 다른 주파수를 갖는 두 개의 적외선 신호를 받을 수 있도록 프로그램 된다. 이 중 하나는 로봇이 재빨리 달아나야 하는 약탈자의 신호다. 이 신 호가 아주 먼 거리로부터 온다면, 로봇은 단순히 장애물을 피하면서 돌아다니기만 하면 된 다. 그러나 가까운 곳에 약탈자가 있다면 곧바로 그 '냄새'를 포착하고 '안전한'거리가 될 때 까지 도망간다. 이러한 반응에서 로봇의 다양한 행동 수준을 발견할 수 있다. 로봇은 사물과의 충돌을 회 피하는 평범하고 기본적인 행동을 보이다가도, 약탈자가 나타나면 최대한 빨리 도망가는 것 에 우선 순위를 둔다. 일곱 난쟁이들의 입장에서 본다면 이 행동은 '나쁜 마녀'효과라고 할 수 있다. 이 행동이 비록 프로그램 된 것이긴 하지만 로봇에 의해 학습된 것이라고 말할 수 있다. 로봇이 약탈자와 매우 가까워졌을 때 벌을 주면 나중에는 다시 가까워지지 않도록 학 습시킬 수 있을 것이다. 그러한 학습 방법을 간단히 설명하고자 한다. 10장에서는 한 로봇이 다른 로봇을 어떻게 가르치는지를 보인다. 약탈자가 있는 상황하에 서 자기 보존은 한 로봇이 다른 로봇으로부터 배울 수 있는 특성임에 분명하다. 또 다른 접 근은 열 대의 로봇 중 다섯 대는 약탈자가 나타났을 때 도망가고, 나머지는 가만히 있는 것 이다. 약탈자가 지독하다면 도망가지 않은 다섯 로봇은 살아 남지 못할 것이다. 당연히 앞으로 의 모든 로봇들은 이렇게 약탈자로부터 살아 남는 로봇과 같이 설계될 것이다. 이것은 본질 적으로 앞으로의 모든 로봇들이 약탈자를 피할 수 있는 기본적인 본능을 갖도록 프로그램되 도록 보장하는 유전공학이다. 이와 비슷한 논의가 7장에서 인간이 호랑이를 만났을 때와 관 련하여 언급되었다. 물론 어떤 이는 약탈자가 특정 주파수를 갖는 적외선을 반드시 방출하는 것은 아니지 않 느냐고 주자할지 모른다. 그러나 거의 대부분 그렇지 않다! 로봇은 간단히 이를 확인한다. 로봇은 물론 인간도 약탈자를 식별해내고, 누군가의 접근 여부를 감지하는 방법을 항상 가 지고 있다. 인간은 시각을 이용한다고 할 수 있다. 이전에 고려했던 예에서와 같이 호랑이와 마주칠 경우 우리는 본능적으로 도망가게 된다. 초음파나 적외선 센서를 사용할 수 있는 로봇들에게 적외선 신호는 이런 것이 가능하다는 것을 설명하는 데 쓰일 뿐이다. 우리는 로봇이 약탈자를 나타내는 신호로서 빛의 세기가 갑 자기 변하는 것에 반응할 수 있도록 광센서를 로봇에게 장착할 수 있다. 갑작스런 빛의 변 화에는 벌레뿐 아니라 심지어 인간도 반응한다. 다른 주파수를 갖는 적외선 신호는 피약탈자를 알리는 신호로 쓰인다. 이 경우 로봇은 신 호가 발생한 쪽으로 이동하고 신호원이 이동하면 이를 추적한다. 일곱 난쟁이 입장에서 본 다면, 백설 공주가 나타났을 때 이를 에워싸는 '백설 공주'효과라고 할 수 있다. 로봇의 약탈자에 대해 했던 것과 똑같은 논의를 피약탈자 관점에서 할 수 있다. 로봇은 평상시에는 분주하게 일을 하다가 피약탈자가 범위 내에 들어왔을 때에만 반응한다. 이런 식으로 로봇은 돌아다니는 생활을 하다가 근처에 피약탈자가 있다는 적외선 신호를 감지하 면 이를 추적하도록 프로그램될 수 있다. 그런데 일곱 난쟁이가 피약탈자에게로 왔을 때 실제로 어떤 일이 벌어질까? 여기서 언급 된 대로 피약탈자는 단지 적외선을 발산하는 전기회로 부품이다. 로봇이 실제로 피약탈자를 잡아먹거나 에너지를 얻을 수 있을 것인가? 대답은 '그렇다'이다. 로봇은 이들로부터 다음과 같이 에너지를 얻어낼 수 있다. 일곱 난쟁이들은 충전 전지를 사용한다. 로봇이 자신의 전지의 상태를 확인하도록 하는 것은 어려운 일이 아니다. 가장 쉬운 방법은 전지내에서 줄어든 전하량을 잴 수 있도록 일 정 시간 동안에 전지에 흘러 간 전류량을 측정하는 것이다. 이것이 실제로 사용되어 온 방 법이다. 로봇의 앞쪽에는 전기 접촉을 할 수 있는 두 개의 범퍼가 장착된다. 로봇은 자신의 전지가 다 닳기 전까지는 일상적으로 돌아다닌다. 이러한 능력을 가진 로 봇을 독이라고 부른다. 이제 그에게는 전지를 재충전하는 것이 우선이다. 어디든 로봇이 혼 자서 재충전할 수 있는 충전소가 있고, 이곳에서는 피약탈자 신호와 같은 적외선 신호를 발 산한다. 일단 로봇이 전지를 충전하기로 했으면 그는 가장 가까운 충전소를 찾기 시작한다. 그리고 발견하자마자 그곳으로 향한다. 일단 독이 충전소에 도착하면 신호가 가장 크게 느껴지는 곳을 찾기 위해 충전소를 중심 으로 빙글빙글 돈다. 이때 신호 발산부 앞으로 이동하여 충전소와 도킹 - 이 로봇의 이름이 어디에서 왔는지 보라! - 한다. 이제 로봇의 전지는 앞에 있는 범퍼와의 전기적 접촉으로 재충전된다. 우선 전지가 완전히 충전되었거나 정해진 충전 시간이 지나면, 로봇은 충전소에 서 떠나 일상생활로 돌아간다. 이렇게 에너지를 유지하는 것은 로봇이 초기에 자신의 전지 가 조금 남아서 충전하기 위해 어딘가에 있을 충전소로 가야 한다는 것을 인지해야 한다는 점에서 가장 어려운 것 중의 하나일 것이다. 더욱 간단한 접근법은 정해진 시간마다(예를 들어 세 시간마다)로봇이 이미 알고 있는 지 정된 장소의 충전소를 찾아가게 하는 것이다. 그러나 레딩 대학에서는 좀더 복잡한 루트를 택했고, 로봇들이 전지가 다 소모되었을 때에는 서로 충전할 수 있도록 되어 있다. 이것으로부터 완전히 자기 충족적인 로봇들을 상상할 수도 있을 것이다. 필요한 것은 맥 도널드 햄버거 가게처럼 여기 저기에 위치한 전기 충전소가 전부이다. 그러나 우리 로봇이 현재 무엇을 할 수 있는지 살펴보자. 일곱 난쟁이의 2세대는 학습을 할 줄 안다. 이전에 설명한 대로, 가장 간단한 형태인 일곱 난쟁이 1세대는 물체가 전방 우측이나 좌 측에 나타나면, 두 바퀴가 적당한 방식으로 반응하도록 프로그램되어 있다. 이렇게 로봇들은 다른 물체에 부딪히지 않으면서도 계속 움직일 수 있다. 다른 물체에 부딪히지 않는 것과 계속 전방으로 나아가는 두 목표는 일곱 난쟁이의 2세대에도 전해졌다. 그러나 두 목표를 수행하도록 미리 프로그램된 로봇의 반응은 학습을 통한 전략으로 이루어지도록 대체되었 다. 넘어지지 않으면서 걸어가는 어린아이와 비교해 보자. 어린아이는 육체적으로는 어느 정 도 시간이 지나면 이 일을 수행할 수 있는 하드웨어를 갖게 되지만, 정신적으로는 시행착오 를 거치며 혼자서 걷는 것을 배워야 한다. 다른 포유류들이 본능적으로 걷는 반면, 인간은 왜 반드시 걷기를 배우도록 진화해 왔는지 고려해 보는 것은 흥미로운 일이다. 난쟁이 로봇 은 필수적인 하드웨어인 회전할 수 있는 바퀴를 갖고 있지만, 로봇들이 어떻게 이동해야 하 는지는 우리가 조정해 왔다. 배쉬풀은 일곱 난쟁이 중 가장 먼저 미리 프로그램된 로봇으로, 다음과 같은 학습 양상을 갖는 새 두뇌로 대치되었다. 전체 문제는 우선 두 분야로 나누어지는데, 첫째는 로봇이 현재 어떠한 상황인지를 파악 하는 것이고, 둘째는 그 상황하에서 무엇을 할 것인지 판단하는 것이다. 우선 상황 파악 부 분을 설명하겠다. 로봇이 직면하는 상황은 상당히 많고, 다양한 시나리오로 구분될 수 있다. 그러나 합당한 범위 내에서 일을 간단히 하기 위하여 배쉬풀에게는 우선 다섯 가지 상황이 주어졌다. 그 다섯 가지는 다음과 같다. 상황1:아무런 물체도 발견이 안됨. 상황2:왼쪽 눈 근처에 물체가 출현. 상황3:오른쪽 눈 근처에 물체가 출현. 상황4:왼쪽 눈 멀리 물체가 출현. 상황5:오른쪽 눈 멀리 물체가 출현. 배쉬풀은 자신의 초음파 '눈'으로 전방의 물체 유무를 알려주는 신호를 수신한다. 그러나 받은 신호는 명백히 '있다'나 '없다'가 아니라 일상생활과 같이 전형적으로 달라진다. 이 신 호는 위의 다섯 가지 경우 중 어느 것이 가장 적합한지 판단할 대략적인 지침만을 준다. 흡필드 네트워크(Hopfield Network:각 뉴런에서 나온 출력 신호가 입력 신호로 다시 되먹 여지는 뉴런의 배열이다. 이것은 정보가 하나의 형태인지 아닌지를 분류하고자 할 때 잘 동 작하는 것으로 알려진 신경 회로망의 특별한 한 형태이다. 따라서 배쉬풀의 상황을 분류하 는 데 매우 유용하다)에 기초한 40개의 뉴런을 갖는 인공 신경망은 스스로를 조직화한다. 즉 초음파 눈으로부터 들어온 신호를 보고 어떠한 상황인지를 판단하기 위해 시냅스의 가중 치를 조절한다. 이 자기 조직은 로봇이 이동할 때 주변으로부터 값들을 얻으면서 이루어진 다. 이러한 형태의 인공 신경망의 동작은 지도의 배치와 비교 설명될 수 있다. 어떤 상황이 일어났을 때 뉴런의 특정한 무리는 다른 것들보다 더 활성화될 것이다. 이것은 각각의 상황 이 지도의 해당 영역 내의 활동에 의해 반영된다는 것을 의미한다. 이제 문제는 배쉬풀이 특정한 상황에서 무엇을 해야 하는지를 결정하는 것이다. 배쉬풀은 두 바퀴의 전후 이동과 정지로 아홉 가지의 동작이 가능하다. 예를 들어 우측 바퀴는 앞으 로 가고 좌측 바퀴는 멈춘다든가, 좌우의 바퀴가 모두 뒤로 가는 것이다. 배쉬풀의 가능한 동작 각각은 간단한 수치인 가중치를 갖는다. 그러나 각기다른 가중치가 다섯 가지의 상황에 각각 주어진다. 어떤 상황에서는 특정한 시간에 가장 높은 가중치를 갖 는 행동이 수행될 수도 있다. 만약 그 행동이 물체를 피하는 데 성공적이었다면, 그 행동의 가중치는 증가하고 다른 가중치들은 감소한다. 반대로 물체를 피하는 데 실패하여 부딪혔다 면, 가중치는 감소하고 다른 가중치들이 증가할 것이다. 이런 식으로 배쉬풀은 주변을 이동 할 수 있고, 그 자외선 눈에 으하여 무슨 상황이 있는지를 우선 배우고, 그 다음 각기 다른 상황에서 어떠한 행동을 취해야 하는지 배우게 된다. 사실 특별한 상황에서는 단순히 가장 높은 가중치의 행동을 취한다기보다 한쪽으로 치우 친 룰렛이 적용되는 것으로 볼 수 있다. 최고 가중치를 갖는 행동이 가장 잘 선택되겠지만, 어떤 때에는 여러 행동들이 다 선택되려고 한다. 최저 가중치 행동이 취해져서 실패할 경우 그 행동은 더 이상 택해지지 않을 것이고, 최고 가중치 행동이 취해져서 성공했다면 다음에 는 더 잘 선택될 것이다. 따라서 학습이 진행됨에 따라 특별한 성공적인 행동들이 각각의 다섯 상황에서 수행될 가능성이 점점 높아진다. 상황1인 경우, 우리는 배쉬풀이 아무런 물체가 없다고 감지했을 때 가장 적합한 행동으로 서, 양쪽 바퀴를 모두 앞으로 굴려서 전방으로 이동하게 하는 것을 배우도록 하고자 한다. 이 경우 직접적인 포상에 의해 앞으로 이동하도록 조정된다. 즉 상황1에서는 두 바퀴가 모 두 앞으로 가도록 하는 것이 좋은 전략이라는 것을 선천적으로 습득하게 된다. 다른 네 개 의 상황에 대해서는 배쉬풀이 장애물에 부딪히지 않고 이동할 수 있는 범위가 존재하며, 배 쉬풀이 어떠한 행동을 배울지는 전혀 알 수 없다. 실제로 배쉬풀은 두세 가지 전략을 바꿈 으로써 스스로 해결할 것이다. 배쉬풀이 처음으로 울타리 같은 형태의 환경에 놓일 때, 가능한 행동과 인공 신경망에 대 한 가중치는 무작위적이긴 하지만 의도적으로 설정되어 있다. 즉 가중치는 서로 다르고 임 의적인 것처럼 보이지만 실제로는 인위적으로 설정되어 있으므로, 5장에서 설명한 대로 '의 도된 무작위'라고 말할 수 있다. 따라서 로봇의 스위치가 켜져 있으면 반응을 빨리 학습할 수 있어 다양한 행동이 가능하다. 앞으로 전진하는 것이 보통 첫 번째 반응이다. 그러나 왼쪽이나 오른쪽에 물체가 나타났 을 때 배우는 전략은 로봇이 전에 해본 성공적인 시도와 직접적으로 연관이 있다. 이 로봇 이 처음 벽에 접근할 때 오른쪽 눈 근처에 벽이 있다고 판단되면, 왼쪽 바퀴를 멈추고 오른 쪽 바퀴를 앞으로 굴림으로써 돌아가는 전략을 배울 것이다. 배쉬풀은 이와는 완전히 반대 의 상황도 조금 덜하긴 하지만 학습하게 된다. 본질적으로 배쉬풀의 전원이 일단 켜지면 어떤 상황과 관계되는 수 많은 행동을 배우지 만, 몇 가지 요인에 의하여 다른 행동을 보이기 때문에 학습할 때마다 매번 다른 배쉬풀이 될 것이다. 그가 인생을 처음 시작할 때 어디에 놓이는가와 초기에 무슨 일이 일어나는가는 성공하는 전략이 무엇인지가 차후의 행동 양식에 지대한 영향을 미친다. 예를 들어 그가 좁은 구석을 향해 가다가 뒤돌아 왼쪽으로 성공적으로 빠져나가고, 이후 에도 계속 성공한다면 그는 남은 인생 동안 이 같은 특성을 간직할 것이다. 배쉬풀은 시행 착오를 통해 배운다. 아마도 여러 번 벽에 부딪히고 나서야 그것이 좋지 않은 방법임을 깨 닫게 될 것이다. 배쉬풀은 초기에 어떤 한 행동을 다른 행동보다도 더 시도해 보려고 하므로, 처음 설정했 던 의도된 무작위에 의한 신경망의 가중치는 중요하다. 이것은 그가 무슨 행동을 할 것인지, 하고자 하는 의지는 어느 정도인지, 그리고 성공하기까지 얼마 동안 실패를 거듭하는지 등 의 초기 행동을 결정한다. 환경이 설정되는 방법 역시 매우 중요하다. 배쉬풀은 울타리의 둘 레 모양과 같은 환경뿐만 아니라 자유로운 이동과 학습, 그리고 넓은 공간이 필요하다. 배쉬풀이 배우는 것은 울타리의 지도나 그 안에 있는 장애물이 아니라 단지 그가 부딪히 지 않고 주어진 환경 내에서 돌아다닐 수 있도록 해주는 수많은 일반적인 행동 양식이다. 이를 이루기 위해서 그는 초음파 눈으로부터 받은 신호와 성공을 거둔 행동들간의 관계를 배워 나간다. 이 학습의 기본 형태는 다른 활동에도 영향을 미칠 수 있다. 예를 들어 배쉬풀이 적외선 수신기를 이용했을 때, 그는 충전소에서 나오는 적외선 신호 의 주파수 특성을 보고 어디로 전지를 충전하러 가야 하는지를 배운다. 1994년에 배쉬풀은 영국 BBC의 <블루 피터 Blue Peter>라는 방송에 출현했다. 그런데 로봇을 멀리 도망치지 못하게 하고는 멀리서 '엄마, 여기 있다'하고 말하려는 순간, 안타깝게 도 어떤 한 진행자가 로봇을 세우려고 손으로 막는 시늉을 하고 말았다. 그 결과 배쉬풀은 극도로 혼란해져서 어디로 가야 할지 망설이게 되었다. 그러나 그는 다른 진행자의 도움으 로 학습할 절호의 기회를 얻었다. 배쉬풀은 새로 태어날 때마다 다른 전략을 배운다. 가끔 그는 한바탕 질주하는데, 한 지점 에서 울타리의 끝까지 앞뒤로 왔다갔다 하면서 단순히 이동한다든가, 갑자기 멈추는 식으로 시간을 소비한다. 그 중 갑자기 멈추는 경우는, 주로 그가 어떻게 움직이든 장애물에 부딪히 게 되어 상당히 혼동스러울 때이다. 이때 마치 그는 인생을 포기한 것처럼 보인다. 그의 전 방 이동의 기본 목표는 움직이지 않으면 확실하게 충돌을 피할 수 있다는 것을 배움으로써 균형을 이루게 된다. 쫓아 오는 다른 물체를 피해 달아나려 하는 성질을 가진 일곱 난쟁이 로봇들 사이에서 배 쉬풀이 충돌 회피를 배울 경우 그는 물체들을 향해 달려야 충돌을 피할 수 있다고 학습하게 될지 모른다. 그러나 이렇게 학습한 배쉬풀이 학습 공간을 두르고 있는 울타리를 피하려 한 다면, 난쟁이 로봇들을 상대로 배운 충돌 회피 방법은 더 이상 통하지 않고, 그저 육중한 울 타리에 부딪힐 뿐이다. 따라서 배쉬풀은 무엇이 좋은 전략인지 망설이게 되고, 그의 인생 초 기에 겪는 움직이는 물체들은 그를 혼동하게 만든다. 인간의 학습에도 이와 유사한 것들이 있다. 악영향이 배제된 좋은 환경의 중요성, 적시적 소에 맞는 특별한 상황의 중요성, 개인의 유전인자 프로그램에 의한 초기 행동이 미치는 영 향력, 그리고 처음부터 잘하려고 하는 특별한 본능과 재능의 정도 등이 그것이다. 적극적인 행동이나 어릴 때 겪는 정신적 충격, 또는 심지어 범죄 같은 양상도 볼수 있을 것이다. 배쉬풀이 특별한 재능을 갖는다는 사실은 여러 가지 방법으로 설명될 수 있다. 우선 작은 성공이 그에게 특별한 전략에 대한 선호도를 갖도록 신경망의 가중치를 조절하여 어떤 행동 으로 강한 경향을 갖게 할 수 있다. 또는 배쉬풀의 신경망 가중치를 특정 환경에서 쉽게 행 동할 수 있도록 인위적으로 조작할 수도 있다. 이러한 면에서 볼 때 배쉬풀의 신경망 가중치의 원래 선택이 '더 나았다'면, 그는 이와 관 련된 행동에 있어서도 '더 나은' 성능을 낼 수 있다고 할 수 있다. 따라서 전체적으로 그의 성능은 초기 유전인자 프로그램과 학습하고 있는 환경, 그리고 그에게 물리적인 문제가 있 을 때 행동에 상당한 영향을 미치게 하는 그의 태도에 달려 있다. 배쉬풀에게는 환경과 특정한 때에 하는 행동이 그가 동작하는 방법에 직접적인 영향을 미 친다. 어떤 때에는 빨리 학습하고 움직이는 데 문제를 거의 일으키지 않으면서 매우 만족스 럽게 돌아다니는 것처럼 보인다. 그러나 잠시 후에는 새로이 학습해야 하고 어려운 상황에 접하게 되며, 더 이상 잘 동작하지 못하는 새로운 배쉬풀이 되고 만다. 이것은 우리 인간이 태어난 날로 되돌아가서 생을 다시 시작한다면, 겪게되는 경험이 달라지게 되므로 완전히 다른 존재가 되는 것과도 같다. 누구나 새로이 시작하면 다른 사람과의 상호 작용이 완전히 달라지기 때문이다. 불행히도 우리는 아직 시간을 뒤로 돌릴 수 없으나, 배쉬풀은 스위치를 전환함으로써 다시 아기로 만들 수 있다. 처음 전원이 켜졌을 때 배쉬풀은 인생의 필수적인 목표도 갖게 되고, 많은 기본적인 본능 도 갖게 된다. 그가 자신의 인생을 시작하는 방식, 즉 맨 처음 무엇을 할지와 어떻게 할지는 사실 프로그램되어 있고, 아직 처음 접하게 되는 환경과는 무관하다. 그의 학습률이 어떤 자 극에 따라 조절된다면 더 나은 다른 학습 방법을 얻는 것이 가능하지만, 그가 배우는 방식 은 본능적이다. 학습률은 흥미로운 요소이다. 높은 학습률을 위해서는 어렸을 때부터 학습하는 것이 좋다 고 알려져 있으며, 시간이 지남에 따라 높은 학습률을 얻기는 점점 어려워진다. 사실 어떤 전략이 시간의 흐름에 따라 성공적이라고 밝혀졌을떼 이러한 경향이 나타난다. 그러나 다른 행동의 가중치는 단지 비례해서 줄어들지만 결코 0이 되지는 않는다. 이런 방식으로는 결코 가능하지 않을 듯싶지만, 배쉬풀은 여러 상황에서 각기 다른 전략을 시도하는 것이 항상 가 능하다. 어떤 시간 후에는 더 이상 학습하지 못하도록 정한 시간 이후에 가중치가 바뀌지 못하게 만드는 것이 가능하지만, 우리는 그러한 방법을 사용하지 않았다. 학습은 계속되었으 며, 신경망 가중치의 변화도 계속되었다. 그러나 고정된 환경에도 배쉬풀은 성격이 상당히 안정된 이후에는 자신의 습관을 버리기 어렵게 된다. 그럼에도 불구하고 그 이상의 학습은 가능하며, 이것은 매우 중요하다. 환경의 특성이 천천히 바뀌면 그것은 배쉬풀이 변화에 따라 점진적으로 적응할 수 있다는 것을 의 미한다. 두 번째로 전략의 극적인 변화가 갑자기 필요하게 되면 배쉬풀은 익숙해져 있던 습 관을 버리기 위해 시간이 필요하므로 보다 천천히 적응할 것이다. 그는 어는 정도는 이전에 학습한 대로 행동하려고 할 것이고, 이제는 더 이상 적당하지 않다는 말도 듣게 될 것이다. 배쉬풀의 행동 중 한 양상은 로봇의 새로운 설계 방식을 제시했다. 그는 자신이 전방 우 측에 장애물이 나타났을 때 오른쪽으로 회전하는 것을 배웠다. 그것을 바탕으로 해서 그는 어떤 장애물, 예를 들어 벽이 전방 좌측에서 감지될 때 그는 왼쪽으로 회전할 것이다. 결국 그가 똑같은 동작을 반복하도록 하면서 장애물은 다시 그의 오른쪽에 놓이게 된다. 이렇게 그는 우연히 벽에 접근하는 방법을 배우게 되고, 벽 앞에서 머리를 한쪽에서 다른 쪽으로 돌리는 것을 배우게 된다. 초기에는 배쉬풀이 어리석은 특성을 배우고 있다고 생각되었다. 그러나 조사 결과 그는 뛰어난 감지 기술을 학습하고 있었지만, 물리적인 설계에 문제가 있 었다는 사실을 알아냈다 일곱 난쟁이의 1세대는 배쉬풀과 마찬가지로 얼굴 좌우 측에 초음파 눈이 달려 있다. 이 러한 설계 때문에 우측 눈이 정확히 벽을 바라보고 있을 때 로봇이 우측으로 회전하면 그의 우측 눈은 벽에서 멀어지지만, 좌측 눈은 가까워지는 것이 가능하다. 물론 반대의 경우도 성 립한다. 따라서 향상된 배쉬풀은 원래의 좌우측 초음파 눈뿐만 아니라 중앙에서 정면에서 주시하는 초음파 눈을 갖도록 설계되었다. 이 접근법은 인공 신경망을 더 복잡하게 하였지만, 머리 돌림 문제를 즉각 해결하였다. 새 로운 중안 눈 시스템을 좌우 측에 두 개의 눈을 갖는 곤충과 비교하는 것은 흥미로운 일이 다. 그러나 이 곤충의 눈은 수많은 작운 홑눈들이 모아진 것이며, 이들 중 많은 홑눈이 실제 로 정면을 보고 있다. 그래서 곤충과 마찬가지로 배쉬풀은 자신의 좌우 뿐만 아니라 정면을 직접 감지하는 것이 필요하다. 초음파 눈에 의해서 묘사가 가능한 상황과 잠재적인 행동의 경우는 지금까지 이 장에서 언급된 것보다 훨씬 많다. 가운데 눈은 설계를 복잡하게 만들긴 하지만, 이로 인해 양 눈은 물체와의 거리에 대하여 상세한 정보를 얻을 수 있었다. 또한 바퀴는 전후방으로 다양한 속 도를 낼 수 있다. 이처럼 비교적 간단한 예에 대해서도 가중치의 학습과 로봇의 인공 신경 망과 관련해 다양한 값이 있을 수 있다. 다양한 종류의 행동과 함께 센서들이 추가됨에 따라 설계는 더욱 복잡하게 된다. 적외선 수신기는 학습되어야 하는 다른 형태의 정보를 제공한다. 그러한 신호에 대한 응답은 먹이 를 추적한다든가 약탈자로부터 도망가는 등의 기본적인 본능으로 간주될 수 있다. 그러나 먹이나 약탈자와 관련된 특별한 신호가 학습되어야 한다. 이것은 신경망에 어떤 층을 확장 하거나 추가하는 것으로 가능해진다. 인공 신경망의 한 층은 다음(더 높은)층이 먹이나 적이 접근해 오거나 중요한 행동이 필요하다고 알려 주는데 반해 장애물과의 충돌과 관련된다. 배쉬풀의 두뇌의 행동은 이제까지 초음파 눈과 바퀴의 방향과 속도로부터 물체와의 거이 와 관련하여 인간의 용어로 묘사되어 왔다. 우리는 실제 무엇이 일어나고 있는지를 이해할 수 있기 때문에 이러한 방식으로 그의 두뇌를 보는 것이 적합하다. 그러나 실제로 배쉬풀은 자신을 선별한다. 그의 두뇌는 초음파 눈으로부터 신호를 받아들이고 분류하며, 배쉬풀 자신 의 내적 만족을 목표로 하는 행동을 유발시킨다. 이렇게 배쉬풀은 자신이 가장 만족하는 방 법으로 두뇌를 조작한다. 배쉬풀은 자신과 그의 센서와 바퀴에 대한 적당한 행동들을 학습한다. 센서가 더해질수록 관련 사항들이 많이 필요하게 되자만, 전체적으로 볼 때 그가 수용하는 센서에 적합하도록 남게 된다. 마찬가지로 다른 포유동물들의 반응은 그들이 가지고 있는 센서들과 수행하는 행동에 적합하도록 되어 있다. 특히 인간이 학습하는 관련 사항들과 각각의 행동들은 우리 의 행동에 매우 적합하다. 우리가 다른 센서를 이용할 때 우리는 두뇌로 처리하기 전에 이미 갖고 있는 센서에 유용 한 신호로 변환한다. 예를 들어 레이더 정보는 주로 납작한 모니터 화면으로 눈을 통해 두 뇌로 전달된다. 다른 방법은 레이더 신호의 표현을 우리의 두뇌로 직접 전달하는 것이며, 그 러기 위해서는 그것을 어떻게 다루어야 하는지 학습해야 한다. 또다른 센서가 일곱 난쟁이 로봇 중 하나에 추가되었을 때 그것은 로봇 두뇌에 직접적으로 영향을 미친다. 배쉬풀의 두뇌는 40개의 뉴런에 해당한다고 앞서 설명했다. 이는 인간이 보통 갖는 1조 개에 비하면 상당히 적은 것이다. 그럼에도 불구하고 많은 양상들이, 예를 들어 학습 등이 입증되고, 다른 행동과 성격들이 나타난다. 단지 아주 작은 계산 처리 능력만이 요구된다. 사실 초창기의 배쉬풀은 아주 오래되고 비교적 간단한 기술인 Z80 마이크로프로세서를 사 용했다. 이러한 제한에도 배쉬풀은 여전히 여분의 두뇌 용량을 갖는다. 이렇게 여유 있게 만 들면 처리 능력과 수행할 일의 균형을 충분히 맞출 수 있다. 많은 경우 사람들은 그들이 하 고자 하는 일을 위해서 실제로 필요한 것보다 훨씬 강력한 처리 능력을 갖는 컴퓨터를 사용 한다. 배쉬풀의 두뇌 능력의 균형성을 관찰해 보자. 어떤 벌레나 유충의 뇌는 약 20개의 뉴런을 가지는데 반해 꿀벌은 보통 10만 개 정도의 뉴런을 갖는다고 보고된다. 따라서 배쉬풀은 비 록 스케일이 작지만 행동을 공부하고 학습하는 데 이상적이다. 그를 주시해 보면 누구든 동 물의 세계와 많은 유사성이 있음을 깨닫게 된다. 인공두뇌학과가 실제로 많은 수의 배쉬풀과 여러 자손 세대를 갖고 있다는 것은 지적할 만하다. <블루 피터>라는 프로그램에 등장했던 원래의 배쉬풀은 일곱 난쟁이의 2세대의 첫 번째 로봇이었다. 마지막 버전 역시 세 번째 초음파 눈과 먹이의 위치와 충전소를 위한 적 외선 수신기를 가지고 있다. 일곱 난쟁이의 3세대는 일괄적으로 함께 만들어졌고 이전의 두 세대에 비하여 간단한 기 술적 진보인 상호 의사 소통이 가능해졌다. 로봇은 적외선 신호를 수신할 수 있을 뿐만 아니라 난쟁이마다 다른 주파수를 갖는 자신 의 신호를 발신할 수 있다 게다가 각 로봇은 다른 로봇들에게 의사를 전달하기 위하여 주신 호에 변조를 가할 수 있다. 주신호는 메시지를 전송하므로 반송파라고 할 수 있다. 메시지 신호는 메시지를 전송하기 위해 반송파를 변조하거나 변화시키므로 변조파이다. 따라서 각 로봇은 각각이 발신하는 적외선을 통해 자신임을 알린다. 많은 수의 일곱 난쟁이의 3세대가 동시에 울타리 안에 있을 때, 각 로봇은 다른 로봇들이 적외선 신호를 확인한다. 이는 누가 신호를 보내고 있는지 알기 위해 주파수 주변을 반복적 으로 폴링(해당되는 주파수를 차례로 검사)함으로써 이루어진다. 이것은 사람이 특별한 소리 를 듣는 것과 매우 유사하다. 로봇이 많은 신호를 수신했을 때 그는 해당하는 로봇들에게 이동한다. 따라서 울타리 내의 모든 로봇들이 인간의 말인 '나 여기 있어'에 해당하는 신호 를 내보내면, 그들은 이에 반응하여 서로의 앞으로 다가서려 할 것이다. 모든 로봇들은 초음파 센서를 가지고 있으며, 이것으로 1세대와 2세대처럼 프로그램이나 학습을 통해 사물과 부딪히지 않을 수 있다. 따라서 그들이 울타리 내에서 서로의 앞으로 이동할 때 서로, 또는 벽이나 다른 장애물에 충돌하지 않을 것이다. 결과적으로 그들은 그들 간의 신호 강도의 차이나 물리적인 차이에 의해 약간의 거리를 두고 무리를 지어 여기저기 쏘다닌다. 각각의 로봇은 일단 마음만 먹으면 리더가 될 수 있는 재능을 부여받았다. 로봇이 리더가 되기로 결정하면 다른 주파수의 신호를 내보낸다. 모든 로봇은 이것을 '들을'때 리더 신호임 을 인식할 수 있고, 그 결과 대다수의 로봇을 향해 앞으로 나아가기보다는 이 리더 신호를 따른다. 그러난 하나 이상의 로봇이 리더가 되는 것도 가능하다 이 경우 가장 가까운 리더 를 따라가거나 추종하는 로봇이 가장 많은 리더를 따라간다. 그렇다면 실제로 로봇은 어떻게 리더를 결정하는가? 지금은 매우 간단하다. 로봇들이 무 리를 지어 있거나 여기저기 쏘 다니는 일이 생겼을 때 근처에서 다른 로봇들을 대체로 보게 될 것이다. 그러나 때때로 당장 시야에 다른 로봇이 안 보일 수도 있다. 그때 그의 자연적인 경향(기본적인 본능)은 앞으로 이동하는 것이고, 동시에 리더 신호를 내보냄으로써 리더가 되겠다고 하는 것이다. 일단 다른 로봇들이 이 신호를 받으면, 여기저기 쏘다니던 것을 멈추 고 리더를 따라간다. 따라서 어느 한 로봇을 리더러 만드는 중요한 요인 중의 하나가 다른 로봇의 말을 든지 않느 것이라고 주장할 수 있다. 서너 로봇이 비슷한 시간에 다른 방향을 보고 있고, 이들 중 어느 누구도 다른 로봇을 볼 수 없으면 다수의 리더가 생길 수 있다. 그 렇게 되면 각자가 리더가 되어 다른 로봇들을 완전히 무시하면서 자신이 보는 방향으로 나 아갈 것이다. 리더는 자신의 앞에 수많은 다른 로봇이 있을 때까지는 리더를 유지하다가 이 시점부터 리더십의 지위르 잃고 자신의 위치로 되돌아온다. 이것은 리더가 반대 방향에서 오는 수많 은 로봇들을 직면했을 때, '나는 더 이상 리더가 되고 싶지 않아, 누구 다른 사람이 하지'라 고 말하는 것과 같다. 그러한 상황은 한 무리의 리더가 다른 무리와 접촉할 때 생길 수 있 다. 또는 리더가 자신의 무리를 이끌고 구석으로 갔다가 빠져나오려고 몸을 돌리자마자 그 를 뒤따르는 로봇과 마주치는 경우이다. 이 경우 생각이 있는 어떠한 로봇이라 하더라도 리 더의 지위를 즉시 그만두려고 할 것이고, 이러한 일은 실제 일어난다. 로봇이 리더가 되기로 하고는 한 방향으로 나아갈 때 다른 어떤 로봇도 뒤따르지 않는 일 도 얼마든지 발생할 수 있다. 로봇들이 모두 완전히 다른 방향의 리더를 따를 수 있다. 특별 한 로봇이 앞서갈 때 매우 강하고 빨리 이동하는 일도 생길 수 있는데, 이때 다른 로봇들은 쉽게 포기하고 혼자서 나아가도록 내버려 둔다. 고독한 로봇은 다른 로봇이 보일 때까지 계 속 제자리에서 맴돌다가 결국 자신의 리더십 주장을 포기하고 무리고 돌아온다. 잘 지지받 는 리더는 바로 리더가 되는 적당한 시기에 적당한 방향으로 -어떤 정치적인 의도도 없이 - 나아가는 것이다. 일단 어떤 무리 내에 리더가 없게 되면 그들은 다른 무리의 리더를 인지하거나 그 무리 자체를 따라다닌다. 반대로 근처에 어떠한 리더도 없다면 그들은 새로운 리더가 나터날 때 까지 여기저기 쏘다닐 것이다. 이것은 이전에 무리를 이끌던 로봇이나 새로운 로봇이 될 수 있다. 이러한 특성의 최종 결과는 로봇이 양과 매우 비슷하게 행동한다는 것이다. 그들은 서로 부딪히지 않으면서 한 영역 내에서 서로 가까운 거리를 유지하며 이동하면서 떼지어 있다. 잠시 후 한 리더가 이들을 이끌고 잠시 동안 떼지어 있을 다른 곳으로 이동하기를 반복한 다. 이때 한 무리 이상의 로봇들이 있을 수 있다. 그러나 보통 한 무리는 곧 다른 무리를 만 나게 되므로 결국 여러 무리가 하나로 뭉쳐지게 된다. 일곱 난쟁이 3세대 모두는 다른 센서들과 결합된 행동을 하기도 한다. 그들은 한 영역 내 에서 아무것도 건드리지 않고 이동한다. '먹이'보관소로 갈 수 있으며, 충전소에서 충전할 수 도 있다. 그리고 자신들이 인지하는 로봇들과 서로 의사 소통할 수 있고, 리더를 따르면서 단체 행동을 보일 수 있다. 이러한 특성들의 일부는 보완적이다. 그러나 장애물을 피하는 동시에 무리짓는 행동은 다 른 로봇을 향해 이동하려는 경향과 멀리 도망가려는 경향을 갖는다는 점에서 서로 모순된 다. 특별한 리더는 어떤 상황에 나타나는가? 이는 적당한 시기에 적당한 장소에 로봇이 있는 경우이다. 그러난 로봇의 물리적인 속성 또한 그들을 얼마간 리더가 되도록 만드어준다. 다 른 로봇의 말을 잘 '듣지'않는 로봇은 더 좋은 기회를 갖게 되며, 사실 물리적으로 더 능력 있는 로봇이 그러하다. 후자의 경우 로봇은 아마도 그의 전지가 더 많이 충전되어 있거나 바퀴가 더 빨리 회전할 수 있어서 더 빨리 이동할 수 있고, 따라서 리더가 되는 것이다. 일 정 기간 그들을 지켜보면 어떤 로봇에게는 거의 기회가 주어지지 않거나 주어지더라도 매우 짧은데 반해, 어떤 로봇은 꽤 자주 리더가 되는 경향이 있다. 리더를 뽑는 방법은 동물이나 심지어 인간에게서 그 유사성을 쉽게 찾아볼 수 있음에도 불구하고 로보에게는 자연스러워 보인다. 재빨리 이동하는 강력한 리더가 나타나면, 능력이 덜한 로봇은 쉽게 낙오되거나 경주에서 지게 된다. 반대로 약한 리더는 더 강한 추종 로봇 들로 구성된 가혹한 무리를 구성한다. 다른 리더십 선택 절차 중 어느 것도 실제로 사용중 인 절차와 잘 맞지 않지만, 다른 리더십 선택 절차들이 로봇에게 부여되는 것도 상당히 가 능성이 있다. 그 중 한 가능성이 독재권인데, 어떤 수단에 의하여 한 로봇이 리더로 선택되고 계속 그 상태를 유지하게 된다. 뒤따르는 무리가 단순히 독재자의 국면으로 가기 때문에 이것은 과 학적으로 관찰하기에 그리 흥미를 유발하는 것은 아니다. 그가 강력하다면 약한 로봇들은 항상 추종하려고 발버둥칠 것이며, 이에 반해 그가 약하다면 더 강한 로봇들이 훼방할 것이 다. 물려받은 리더십에 대해서도 상황은 비슷하다. 로봇에 대한 대안은 단순히 미리 정해진 기간 동안 리더를 차례로 하는 것이다. 이것은 좀더 흥미로운 일이지만 과격파 리더와 다시 충돌을 일으키게 한다. 민주적인 선택을 위한 가장 생존에 적합한 대안은 저절로 발생하지만 그러한 절차는 40개 이상의 뉴런을 갖는 두뇌를 요구한다. 첫째로 각 로봇은 측정된 많은 요인들에 기초한 판단 을 내려야 하고, 이전에 일어난 일들을 잊지 않도록 기억하는 것이 필요하다. 민주적인 로봇 선거는 흥미로운 주제이고 기술적으로 상당히 가능성이 있지만, 현재 로봇들의 두뇌 용량을 초월한다. 단지 가능한 것은 선거에 입후보하는 로봇들이 리더로서 어떠한 행동을 - 예를 들어 그 들이 얼마나 빠르게 또는 느리게 가겠는지 - 하겠다는 의미의 많은 신호를 내보내는 것이 다. 그렇게 되면 로봇들 각각은 선거 입후보자들을 얼마나 믿는지 결정해야 한다. 선택될 목 표의 강도는 입후보자들이 얼마나 그들의 앞날에 대한 주장을 과장하는지에 의해 결정될 것 이다. 지금은 리더가 많은 수의 로봇이 자신이 원하는 방향을 막고 있다는 것을 알게 되면, 그 통치권을 포기한다. 이것은 이러한 일을 수행하는 적절한 방법인 것 같다. 그럼에도 불구하 고, 리더는 새로운 리더가 나타나는 식의 도전을 받기 전에는 포기하지 않을 수 있다. 그렇 게 되면 선택 즉 리더들 간의 전쟁이 일어날 수도 있다. 이미 논의된 바와 같이 선거도 하나의 가능한 방법이다. 그러나 이론상 리더 로봇들 중 하나만이 물리적으로 이끌어 갈 수 있는 상화이 될 때까지 그들 간에 전쟁이 일어날 수도 있을 것이다. 예를 들어. 장애물 회피의 성질이 전쟁중에는 무시되어서 로봇들 간에 가장 빠 른 속도로 충동했다가 다시 멀어지는 식으로 로봇 하나만 남을 때까지 이를 반복할 수도 있 은 것이다. 이러한 성질은 로봇들에게 쉽게 주입될 수 있지만, 실험하기에는 돈이 상당히 많 이 드는 방법이며, 따라서 우리가 실제로 해볼 만한 방법으로 여겨지지 않는다. 단 하나의 로봇을 연구할 때는 그러한 행동과 성질들을 인간 등의 동물이나 곤충과 직접 비교할 수 있다. 로봇의 단순한 반응을 살펴봄으로써 우리는 인간과 비슷한 행동 양식을 생 각하게 된다. 일곱 난쟁이 로봇들의 3세대에 대해서는 특별한 이점을 갖는 리더십을 이용해 단체 행동도 관찰할 수 있었다. 한때 런던의 어느 여학교에서 시연하기 위하여 로봇들을 가져간 적이 있었다. 시연장은 다소 추웠다. 결국 로봇들 중 하나가 느리다 못해 움직이려고 하지 않았다. 다른 로봇들은 불쌍한 그 로봇 주위에 모여 화가 난 것처럼 앞뒤로 움지이며 겁을 주었다. 이것 때문에 보 러 온 많은 어린 여학생들뿐 아니라 나까지도 그 로봇에게 동정심을 느끼게 되었다. 그 로 봇은 갇힌 채 다른 로봇들로부터 공격당했으며, 마치 절망적으로 겁먹은 듯이 보였다. 내가 로봇을 곤경에서 꺼내다 모든 사람들이 큰 소리로 격려했다. 일곱 난쟁이의 3세대는 자신들끼리 의사 소통을 할 수 있을 것이고, 이것은 연구의 완전 히 새로운 영역을 열 것이다. 그들이 어떠한 대화를 주고받을 것인가, 이것이 어떠한 영향을 끼칠 것인가, 그리고 그 반응으로 어떻게 행동할 것인가? 로봇 프로그램에 대한 계획은 무 엇이고 이것이 과연 우리를 어디로 데려갈 것인가? CHAPTER 10 차세대 로봇 인공지능을 통해 레딩의 일곱 난쟁이와 보행 로봇의 특성 및 행동을 묘사하려는 것은 오 류를 범할 수도 있다. 인간의 지능이 필요한 행동을 모사하려는 시도는 아직 없었다. 각 로 봇의 행동양식은 그 로봇과 그 로봇의 능력에 맞게끔 되어 있다. 그렇지만 어떤 행동에는 곤충과 비교할만한 점이 있을 수 있다. 때로는 포유류와 비슷한 점이 있으며, 인간과 비슷한 점도 있다. 현존하는 대부분의 로봇은 매우 낮은 지능을 가지고 있어서, 데이브 키팅(Dave Keating) 은 로봇을 '사람이 만든 바보'(artificial stupidity)라고 부르기도 했다. 이것은 적절한 비유일 수도 아닐 수도 있다. 내가 현재 우리의 로봇 프로그램에서 어떠한 일이 진행중이며, 머지 않은 장래에 무엇이 일어날 수 있는지, 그리고 그 외에 일어날 수 있는 다른 가능성들을 기 술한다면, 어쩌면 당신은 이 장의 마지막에서 당신 자신만의 결론을 이끌어낼 수도 있을 것 이다. 그러면 현재 어떤 연구가 진행되고 있는가? 두 연구원 학생인, 아이언 켈리(Ian Kelly)와 이아인 굿휴(Iain Goodhew)는 일곱 난쟁이 프로그램을 진행하고 있다. 이들은 약탈자/비약 탈자에 관한 행동과 충전 장소로의 귀환 행동에 관한 기능을 도입할 뿐 아니라 통신 기능을 갖춘 3세대 로봇 제작을 담당하고 있다. 아이언 켈리는 최근 로봇간의 교시와 학습을 가능 하게 하는 작업에 전념하고 있다. 현재 이들 로봇 중 몇몇은 무선 송수신기를 장착하고 있어서 컴퓨터 같은 원격 기지국이 나 다른 로봇간의 통신은 교환 학습을 가능하게 해주었다. 예를 들어, 두 로봇은 각각의 학 습 장소에서 주위를 움직이고 충돌을 피할 수 있는지에 대한 학습을 시작한다. 앞 장에 기술한 바와 같은 간단한 학습뿐 아니라, 로봇들은 그들의 성공과 실패의 경험을 무선 통신을 통하여 서로 전달할 수 있다. 그래서 한 개의 일곱 난쟁이 로봇은 스스로의 경 험을 통하여 학습할 수 있다. 흥미롭게도, 두 로봇이 상호간에 학습하는 것은 꽤 수월하였으 나, 반면에 세 개 또는 그 이상의 로봇 사이에서는 어떤 로봇을 더 믿어야 하는가, 혹은 어 떤 로봇의 정보가 신뢰성이 있는가 하는 문제가 발생했다. 두 로봇은, 각자의 영역을 움직이면서 어떻게 움직여야 하는지 서로 배우며 빨리 학습할 수 있다. 간단히 말하자면 각각의 로봇은 각자의 영역을 움직이면서 시행착오로 생긴 정보 를 습득함과 동시에, 이들이 각기 얻은 정보를 상대방에게 전해주거나 전해받을 수 있다. 그러나 두 로봇이 동시에 학습을 시작해서는 안 된다. 둘 중 하나가 자신의 영역에서 자 신만의 방법을 터득하여 그 로봇의 행동패턴이 안정화된 후에라야 다른 하나의 로봇이 그 자신의 영역에서 학습을 시작할 수 있다. 그리고 나서 처음 학습을 시작한 로봇은 무선 통 신을 통하여 '어린' 로봇인 두 번째 로봇에게 매우 강하게 정의된 정보를 보낸다. 즉 '이것들 은 네가 직면하게 될 상황이다', '이것은 그런 상황들에서 내가 성공적으로 행동한 것이다' 라는 식으로 보낸다. 이 관계는 학습이라기보다는 명백히 사제 관계, 혹은 부모 관계의 하나가 될 것이다. 그렇 다면 이제 다음과 같은 어려운 질문을 던져 본다. 학생 로봇은 선생 로봇이 전해준 것에 반 하여 자신의 경험에 대해서 얼마의 가중치를 둘 것인가? 또한 선생은 학생의 경험에 대하여 얼마의 가중치를 둘 것인가? 어쩌면 학생은 특별한 상황을 다루는 새로운 방법을 학습할 수 도 있는데, 그러면 선생은 이에 대해 주의를 기울여야 하는가? 여기에는 명백히 학생이 스스로의 경험만을 신뢰하면서 선생의 경험에 전혀 의존하지 않 는 경우에서부터 둘 사이의 경험에 균형을 가지며 접근하는 경우, 자신의 경험은 신뢰하지 않으면서 선생에게만 완전히 의존하는 극단적인 경우까지 다양하게 존재한다. 학생이 선생의 정보에 대하여 전혀 가중치를 두지 않을 때, 완전히 독립적으로 학습하고 다양한 가능성을 경험하기까지는 오랜 시간이 걸릴 것이다. 따라서 로봇의 행동이 안정되기 까지 역시 오랜 시간이 걸릴 것이며, 독립적으로 선생과는 다른 방법으로 다양한 특성을 학 습할 것이다. 예를 들어 선생은 모서리에 직면했을 때 어떤 방법으로 행동할 것인지를 배웠 을 것이다. 만약 학생이 선생에게 아무런 주의도 기울이지 않는다면 동일한 상황에 이르렀 을 때 완전히 다른 행동을 학습할 가능성이 크다. 반대로 학생이 선생의 말을 전적으로 신 뢰하고 자신의 경험에 중요성을 두지 않는다면, 자신의 환경이 선생의 환경과 많이 다를 경 우에는 문제가 생길 수 있다. 학생이 있는 장소에는 모서리가 있고, 선생이 있는 장소에는 모서리가 없을 때 학생이 전 혀 자신의 경험을 사용하지 않는다면, 선생에게는 제일 좋지만 자신에게는 상당히 나쁜 방 식으로 행동할 수도 있다. 그러나 긍정적인 관점에서 선생의 두뇌는 상당히 안정되어 있기 때문에 두뇌 동작을 학생에게 일괄적으로 전달될 수 있다. 학생의 두뇌는 즉시 선생의 두뇌 를 복사할 수가 있다. 그러나 선생 로봇이 자신의 두뇌 동작을 학생 로봇에게 완전히 넘겨줘서 학생 로봇이 선 생 로봇과 똑같은 방식으로 행동하게 된다면 실제로 이들간에 무슨 일이 일어나고 있는 것 인가? 간단하게, 선생 로봇은 학생 로봇을 프로그램시키고 있는 것이다. 물론 도미노 효과가 진행되는 것을 막는 방법은 없다. 프로그램된 학생은 또다른 로봇을 프로그래밍 시키고 이 것은 계속해서 일어나게 된다. 두 가지 극단적인 경우 - 학생 로봇이 선생 로봇으로부터 전부를 얻든지 아무것도 얻지 않는 것 -는 비교적 쉽게 설정할 수 있다. 그러나 인간은 이 두 가지 극단적인 경우의 중간 에서 행동하고 있으며, 로봇에 대해서도 같은 방식을 적용하고 있다. 학생 로봇은 선생의 말 과 스스로의 경험에 대하여 균형잡힌 가중치를 둔다. 적절한 가중치는 현재 중요한 연구 주 제이다. 그러나 선생 로봇과 학생 로봇은 각자가 자신의 주위만을 움직인다는 점에서 처한 상황은 인간의 경우와 약간 차이가 있다. 선생은 마주친 여러 상황에 대해 이미 성공한 전략에 대 한 정보를 보낸다. 그 순간 아마도 학생은 다른 상황에 직면해서 자신의 시행 착오를 통해 서 경험을 얻고 있을 것이다. 어떤 상황에 대해서는 학생 로봇이 좀더 일찍 그 상황을 겪어 서 선생으로부터 사전 정보를 가지고 있지 않는 경우도 있을 것이다. 반면에 다른 상황에 대해서는 선생이 구체적인 정보를 이미 전해 줬을 수도 있다. 현재로서는 선생 로봇이 학생 로봇을 어떤 특별한 상황으로 데리고 가서 그때 어떻게 했는지 알려주지는 못한다. 이것은 인간의 사제 관계에서 자연스런 모습이다. 지금까지 우리는 선생이 준 정보에 대한 학생 신뢰도에 대해 다양한 실험을 하였다. 즉 학생 로봇이 선생 로봇의 말을 어느 정도 믿는가? 그리고 그와 관련하여 학생 로봇이 자신 의 경험을 어느 정도나 믿고 있느냐는 것이다. 이 문제는 복잡하다. 학생 로봇이 아직 경험하지 못한 상황을 어떻게 해야 할지에 관한 많은 양의 정보를 전달 받을 때, 학생이 실제적으로 직면할 문제에 어느 정도나 적응할 것인가? 다시 말해 학생이 경험하지 않은 상황에 대해서 이미 선생으로부터 받은 경험 지식을 바탕으로 자신의 마음을 확실히 정할 수 있을 것인가? 학생 로봇이 어떤 상황에 대해 성공적인 해법을 발견한 후에, 선생 로봇으로부터 자신의 것과는 다르지만 성공적인 해법을 전달받는다면 또다른 어려운 결정을 내려야 한다. 두 해법을 평균하는 것은 성공적이지 못한 전략을 낳을 수도 있다. 그러면 자신의 것과 선생의 것 중에서 어떤 것을 선택해야 될 것인가? 어떤 것이 더 좋은 것인가? 그러면 한번 이들 사이의 유사성을 찾아보자. 로봇이 직면한 이러한 문제들에 대해서 인 간, 또는 다른 동물의 행동과 유사점을 이끌어 내는 것은 어려운 문제가 아니다. 이제 이들 사이의 유사성을 한번 찾아 보자. 인간으로서 우리가 행동하는 양식을 생각해 보면 종종 로 봇과 연관된 직접적인 해답을 얻을 수 있다. 종족에 따라서 약간의 차이는 있지만, 학습하는 방식은 로봇이나 동물이나 대개 비슷하다는 것을 알아야 한다. 예를 들어 인간 선생이 미소 를 지으면서 얘기하는 내용을 인간 학생은 아마 모두 다 깊이 있게 들으려고 할 것이다. 이 런 요소가 능숙한 판매원이 되는 요소가 되기는 하지만, 현재 웃음에 대한 물리적 역량이 없는 로봇에 대해 직접 이 특징을 관련시키는 것은 어렵다. 그러면 당신이 학생 일곱 난쟁이 로봇이라면 당신의 삶은 어떠할까? 상당히 제한된 두뇌 능력을 가진 작은 크기의 삶은 어떠할까? 아마 벌레나 작은 곤충의 삶이 어떠한가를 생각해 보는 것이 제일 좋을 것이다. 이들의 삶의 목적들은 비교적 간단하며, 이러한 것들을 다루는 두뇌의 능력과 물리적인 속성도 상대적으로 간단하다. 2차원적인 사고를 할 기회가 있는가? 이러한 질문들은 4장으로 되돌아가며, 우리는 이 질문에 대해서 분명한 답을 가지기는 어려 울 것이다. 여기서 나는 우리가 알고 있는 것에만 집중하고자 한다. 당신이 학생 로봇이라면 전원 스위치가 켜지기 전까지 당신이란 존재는 없다. 전원 스위 치가 켜지면 의식을 갖게 된다. 따라서 당신의 삶은 당신의 스위치를 켜고 끄는 사람에게 의존하게 된다. 당신이 가진 감각기관은 초음파, 적외선, 무선 장치이다. 당신은 인간의 눈, 귀, 코가 없다. 당신 주위의 세계에 대해서 얻을 수 있는 정보는 오직 당신이 가진 세 가지 센서들을 통해서만이 가능하다. 본능은 당신에게 주위를 움직이라고 말할 것이고, 또다른 본 능은 당신에게 어떤 것에 가까이 가는 것은 좋지 않다고 말할 것이다. 당신은 주위를 움직이려고 시도하면서 다른 것에 충돌하지 않는 것이 좋다고 배운다. 그 래서 당신은 당신의 현재 움직임에 대하여 확신이 생기게 된다. 당신이 무언가에 충돌하게 되면 이것은 좋지 않다고 배운다. 그러면 당신은 같은 행동을 반복하는 것에 대해서 확신을 갖지 못하게 된다. 그러나 바로 이때, 무선 통신을 통해서 특정한 상황에 처했을 때 당신이 어떤 특정한 일을 하도록 권장하는 메시지를 듣게 되고, 그로 인해 당신은 지시된 일을 하 는 데에서 확신을 갖게 되고, 자신에게 이러한 상황이 아직 발생하지 않았더라도 그 일을 수행하는데 주저하지 않는다. 허용할 수 있을 정도로 거의 실수를 하지 않는 단계까지 당신 이 주위를 움직이는 동안 다른 것과 충돌하지 않으면 점점 더 확신을 가질 것이다. 어쨌든 당신은 기계이다. 다음은 적외선 신호이다. 당신은 당신 자신의 신호를 보내는 본능을 가지고 있다. 당신은 먼거리에서 동시에 오는 상당한 수의 적외선 신호들을 골라잡을 수 있다. 그래서 그들에게 로 나갈 수 있다. 그러나 어떤 것에 충돌하면 안 된다고 학습되었기 때문에, 접근했을 때는 가까이 다가가지 않는다. 갑작스럽게 당신은 지도자로부터의 신호를 받고 그 신호를 따르는 것에 주의를 기울이게 된다. 그 신호가 없어질 때까지 당신은 그런 행동을 계속할 것이다. 그리고 나서 당신은 다른 적외선 신호가 많은 곳에 가까이 머물 수 있도록 돌아간다. 당신 은 다른 로봇을 보거나 촉감을 느낄 수 없음을 기억하라. 언제라도 당신의 무선 연결을 통 하여 정보를 받을 수 있지만, 당신은 적외선과 초음파 신호에 대해서만 골라내고 응답할 수 있다. 주위를 움직이면서, 어느 순간 당신은 어떤 초음파 신호도 더 이상 받지 못하는 상황을 맞을 수 있다. 당신 앞에는 아무것도 없다. 장벽도 없다. 당신의 길을 가로막는 것은 아무것 도 없다. 그래서 당신은 스스로 '나는 지도자다'라는 신호를 보낸다. 그리고 열려진 공간을 향해 나간다. 잠시 주위를 움직인후에 고정된 물체나 로봇으로부터 오는 초음파 신호를 받 아 당신도 응답을 해주기도 한다. 이것이 당신의 삶이다. 이것이 스위치가 꺼지거나 당신의 전지가 바닥나기 전까지 해야 할 모든 것이다. 이것은 만약 당신이 전지의 충전량을 알 수 있는 장치를 가지고 있다면, 충 전이 필요할 때에 충전 장소로 이동할 때까지 해야 할 일들이다. 현재, 일곱 난쟁이 로봇인 당신에게 중년의 위기가 없다. 일단 당신이 주위를 어떻게 움직 이는지 배우면, 당신이 죽기 전까지 즉 스위치가 꺼지기 전까지 궁극적으로 할 것은 이것이 전부다. 일곱 난쟁이 로봇의 삶을 인간의 삶과 비교해보면 흥미롭지 못한 면이 있을 수 있다. 그 러나 다른 특징들이 추가됨에 따라서, 로봇은 변하고 있다. 최근에 아이언과 이아인(켈리와 굿휴)이 추가한 한 가지 기능은 로봇이 전송한 무선 신호를 골라잡는 원격 컴퓨터이다. 원격 컴퓨터 화면으로 로봇이 무엇을 하는지, 왜 하는지, 그 결과는 어떤지를 보는 것이 가능하다. 그래서 효율적으로 로봇이 배워야 할 것을 언제 배우는지와 상당히 고정된 두뇌 형태로 단순하게 주위를 움직이는 것을 쉽게 볼 수 있다. 로봇과 컴퓨터 사이의 무선 통신은 쌍방향이고 이것은 컴퓨터가 선생 로봇처럼 학생 로봇 에게 정보를 보낼 수 있다는 것을 의미한다. 두 컴퓨터를 함께 연결해 놓음으로써, 한 장소 에 있는 선생 로봇이 자신의 경험을 컴퓨터로 전하고, 이 컴퓨터가 그 정보를 두 번째 컴퓨 터에 전하며, 최종적으로 두 번째 컴퓨터는 무선을 통하여 그 정보를 두 번째 장소에 있는 학생 로봇에게 보냄으로서 선생 로봇의 역할이 가능해진다. 따라서 학생 로봇은 부분적으로 는 자신의 경험으로, 그리고 컴퓨터 대 컴퓨터 연결(computer-to-computer link)을 통해 선 생 로봇에 의한 학습을 할 수 있다. 이 실험은 1996년 봄 레딩 대학교의 인공 두뇌학 연구 실에서 처음으로 성공적으로 수행되었다. 컴퓨터 대 컴퓨터 연결은 연구 분야에서 전반적으로 새로운 측면을 열었다. 인터넷을 통 하여 컴퓨터들은 수초 안에 서로간의 통신으로써 전 세계에 걸쳐 연결될 수 있다. 이것은 레딩에 있는 우리에게 선생 로봇의 가능성을 사용하여, 전 세계에 걸쳐 다른 장소에 있는 학생 로봇을 학습할 수 있게 하였다. 1996년 11월 뉴욕과 도쿄에 위치한 학생 로봇에 대하 여 레딩의 선생 로봇에 의한 학습 실험이 처음으로 성공적으로 수행되었다. 이 실험은 기계의 능력을 향상시키는데 결정적인 역할을 하였다. 어떤 기계가 세계의 어 디에 있든지 다른 기계가 가르쳐 준 것을 근거로 하여 행동하게 할 수 있다. 그 후에 이 기 계는 수초 안에도 다른 기계에게 같은 방법으로 행동하도록 대략적으로 가르칠 수 있었다. 첫 번째 기계의 학습은 확신 있는 행동에 기반하고 있다. 인간에 의해 확신이 있는 것과 그렇지 않은 것이 프로그램될 수 있으나, 스위치가 꺼지지 않도록 하는 행동과 같은 '확신을 가질 수 있는' 활동은 스스로 학습할 수 있을 것이다. 그러나 레딩의 로봇은 그러한 성능을 가지지 못한다. 우리가 해왔던 모든 것은 무엇이 가능한 행동인지를 보여줄 뿐이다. 일곱 난쟁이 로봇에는 여러 가지 특징들이 있는데, 그것을 적절히 수용하기 위해서는 마 이크로프로세서 기반의 두뇌 능력을 증가시킬 필요가 있었다. 일곱 난쟁이의 최근 두뇌는 거의 500여개 정도의 뉴런을 가지고 있다. 이아인 굿휴는 로 봇의 꼭대기에 겹눈을 다는 일을 담당하고 있다. 눈은 각각 조금씩 다른 방향을 가리키고 있는 많은 수의 광 트랜지스터로 이루어진다. 광 트랜지스터는 빛의 유무를 알려준다. 빛의 세기에 따라 각각의 광 트랜지스터에 흐르는 전류의 세기가 변한다. 파리의 눈과 비슷한 겹눈은 민친턴 세포(Minchinton cells)라고 불리는 수많은 뉴런들로 이루어진 인공 신경망과 직접 연결된다. 그 뉴런들은 빛의 패턴들에 대해서 잘 작동한다. 예 를 들어 로봇이 방안에서 빛의 패턴을 감지할 수 있는 특별한 위치에 있다고 하자. 물론, 이 패턴은 전등이 켜졌는지 꺼졌는지 혹은 창문이 어디에 위치해 있는지에 등에 따라 다르다. 민친턴 뉴런들이 눈에 의해 감지된 빛의 패턴을 대략적으로 기억하도록 배열하면, 로봇은 그 위치에서 빛의 패턴을 학습한다. 민친턴 뉴런들은 우리의 눈처럼 정확한 패턴보다는 일 반적인 패턴에 의하여 동작되기 때문에 나는 '개략적으로'라고 말했다. 그 결과로서 신경 회 로망은 유사한 빛의 패턴을 보고 이를 인식하게 된다. 겹눈을 가진 로봇은 방의 임의 장소에 놓여져서 원래 위치로 돌아가는 길을 찾으라고 요 구받을 수 있다. 로봇은 어디 있든지 학습된 빛의 패턴과 더 많이 일치하는 곳을 찾는 방식 으로 원래 위치를 찾는다. 좀더 잘 맞는 방향으로 연속적으로 이동하면, 로봇은 원래 위치로 돌아가는 길을 찾을 수 있다. 그러나 직선 조명(strip lighting)을 사용하거나, 창을 통하여 나타나는 연속적인 빛 패 턴을 가지는 방에서 단지 빛의 세기만으로 이전의 위치를 찾는 것은 문제가 될 수 있다. 이 경우, 로봇은 원래 위치가 아닌 상대적으로 적절한 위치로 돌아갈 수도 있다. 글 점으로부터 다른 방향으로 움직이는 것은 부분적으로는 최상의 것일지라도 방 전체로 볼 때는 최상의 빛의 패턴 매칭이 아니다. 그러므로 로봇이 지역적인 최적의 패턴 매칭을 얻고 난 후 매칭 정도가 그리 좋지 않으면, 로봇은 짧은 기간 동안 임의의 방향으로 다시 움직여 본다. 겹눈을 사용하여 로봇에게 강하고 독특한 조명이 있는 어떤 위치를 가르치고 난 후에 그 곳을 찾게끔 하는 것은 쉬운 일이다. 특히 특별하고 평범하지 않은 각도에서 밝은 빛이 비 춰지면, 다음에 로봇이 제 위치를 찾기 쉽다. 그러나 평범하고 일상적인 조명이 비치는 장소 는 문제를 더욱 어렵게 만든다. 이들 조명이 단순하면서 구별이 쉬운, 독특한 특징을 갖고 있지 않기 때문이다. 겹눈으로 위치를 학습하는 것은 로봇이 빛의 밝기만으로 방을 인식하는 학습을 할 수 있 도록 쉬 게 확장할 수 있다. 로봇은 빛의 밝기만을 가지고 매우 정확히 방 주위의 길을 발 견할 수 있다. 그러나 이것은 아직까지는 성공하지 못했고 앞으로 개발될 것이다. 진행중인 다른 프로젝트는 로봇들에게 각종 장치를 추가하는 것이다. 초기에 작은 두 손 가락을 가지며 아래위로 손목을 움직일 수 있는 집게 장치가 추가되었다. 이와 함께 집게에 는 접촉 센서와 미끄러짐을 감지할 수 있는 음향(소리)센서가 있다. 목표는 관련된 센서와 함께 로봇의 신경 회로망 구조에 집게 장치를 통합하는 것이다. 집게를 장착함으로써 로봇은 자신의 환경에서 상호작용을 하고 잡고 움직일 수 있을 것이 다. 8장에서 기술한 바가 있는 브룩스의 행동수준(Brooksian levels)에서 이것은 붙잡고 방 해하는 수준 6과 7이 된다. 당장에는 게의 집게발과 같은 두 손가락 장치는 이러한 작은 로 봇들이 완벽하게 다루기에는 복잡하다. 3장에서 지적한 것처럼 손가락을 좀 더 갖는 것이나 더 많은 팔을 붙이는 것도 일을 훨씬 더 복잡하게 만든다. 그러나 이러한 것은 지금 당장 필요하지 않다. 총체적인 목표는 로봇이 각 장치와 신경 회로망을 이용한 센서로 학습하고 제어하고자 하는 것이다. 이를 제어하기 위해 복잡한 수식을 유도하는 것은 의도한 바가 아 니다. 또 다른 흥미 있는 연구 방향은 연구원 학생인 벤 헷(Ben Hutt)에 의해 수행되고 있는 유전 공학을 이용한 진화 로봇이다. 다수의 로봇의 특징과 특성은 그들이 존재하는 구체적 인 환경에 따라 컴퓨터에 입력될 수 있다. 전원을 얻는 방법, 약탈자의 존재 여부와 일반적 인 생존 필 수 요건이 중요한 요소이다. 각 로봇은 환경에 얼마나 잘 적응하는지 조사할 수 있다. 그 다음 로봇의 특징들은 컴퓨터 모의실험을 통하여 유전학적으로 섞여서 다음 세대 에 전달된다. 이 과정은 많은 세대를 통하여 반복될 수 있다. 컴퓨터 안에서의 세대를 통해 유전학적으로 진화하는 로봇들의 큰 장점은 수분 내에 문제 가 풀릴 수 있다는 것이다. 이것은 인간 또는 포유동물들이 특징을 진화시키는 데 수백 내 지 수천 년이 걸린 것과 비교될 만하다. 실제 환경의 실제 로봇에서 얻어진 로봇의 특징들 을 환경에 더 잘 대처할 때까지 많은 세대를 거치며, 컴퓨터 안에서 유전학적으로 설계될 수 있다. 이 로봇, 또는 심지어 완전히 새로운 로봇 세대조차 물리적으로 짜 맞추어질 수 있 다. 포유류의 진화처럼 컴퓨터를 기반으로 한 진화도 비교적 작은 단계로 일어나기보다는, 많 은 물리적 변화가 물리적으로 짜 맞추어진 한 세대와 다름 세대 사이에서 일어날 수 있다. 중간의 세대는 단순히 컴퓨터 안에서만 존재하고 실제 세계에는 존재하지 않는다. 좀더 향 상된 자손을 생산하기 위해서 한 세대의 가장 나은 로봇에서 추출된 특징을 한데 섞는 유전 자 작업 뿐만 아니라 돌연변이도 시도되고 있다. 이렇게 새로운 특징들이 첨가되거나 기존의 특징들이 임의로 변화될 수 있다. 만약 돌연 변이가 성공적이라면, 로봇은 모의실험을 통한 환경에서 번성할 것이다. 그리고 미래의 세대 인 자손에게 영향을 줄 것이다. 만약 그것이 합리적으로 성공을 거둔다면, 첫 돌연변이가 좀 더 많은 세대를 통해 진화하는 것이 좋을 것이다. 반대로, 돌연변이가 한 세대의 로봇에 도 움이 되지 않고 모의 실험 환경 안에서 상태가 나쁘면, 그 로봇은 폐기될 것이다. 돌연변이는 그 로봇들이 더 나은 방식으로 수행할 수 있는지의 여부를 가늠하기 위한 새 로운 아이디어를 시도할 의도로 모의 실험상에서 이용될 수 있다. 만약 그 착상이 좋으면, 무엇인가 더 나은 쪽으로 많은 세대가 진화한다, 만약 그것이 나쁜 착상이었으면, 상당히 제 한된 효과만을 가지며 빠르게 사라질 것이다. 때로는 두 개의 나쁜 착상이 하나의 좋은 결 과를 만들 수 있으므로, 나쁜 돌연변이는 너무 빨리 폐기하지 않도록 한다. 유전학을 공학에 적용하는 것은 단순히 로봇을 향상시키는 것 이상의 새로운 분야와 연구 방향을 열어 주었다. 수많은 중요한 요인들 중에 하나는 모의 실험을 통해 세대에서 로봇 수의 규모이다. 다음 세대의 수가 늘어나는 것을 허용해야 하는가? 아니면 같은 크기로 고 정하여야 하는가? 같은 크기를 유지하면 일정한 숫자의 로봇이 한 세대에서 다음 세대로 가 는 동안 유지될 수 있는 것이다. 우리는 향상을 기대하기에 쇠퇴해 가는 로봇이 있다면 폐기하겠지만, 오랜기간 동안 유용 했다. 반대로 인구 증가를 허용한다면, 어떤 환경에서 최상의 로봇을 찾을 때에 더 많은 계 산 시간이 걸릴 뿐 아니라 많은 수의 나쁜 돌연변이 때문에 평균 성능이 쉽게 저하될 수 있 다. 로봇이 유전학적으로 진화할 때, 컴퓨터에 비교적 간결하게 환경의 두드러진 특징을 기록 해 두는 것이 중요하다. 당연히 각 로봇의 특징에 대해서도 마찬가지다. 인간의 진화에 영향 을 준 지구 환경의 중요한 특징을 기록하고, 환경에 좀더 적합하게끔 진화를 진행시킨 인간 의 중요한 특징을 기록해 본다고 상상하라. 어떤 인간이 지구에서 잘 적응했으며, 왜 그랬는 지 쉽게 말하기는 상당히 힘들며, 컴퓨터상에서 그들의 두드러진 특징을 분류하는 것도 어 렵다. 아직까지 인간은 실제 세계에서 유전학적으로 진화한다. 만약 환경이 변화한다면 -예 를 들어 지구의 온난화가 일어난다면 - 이를 잘 극복하는 사람이 환경을 잘 극복할 수 있 는 자손을 생산할 것이며, 이것은 계속될 것이다. 환경과 환경 안에서의 피조물을 - 로봇의 경우처럼 컴퓨터 코드로 -간결하게 나타내는 것은 매우 어려운 문제이다. 컴퓨터 안에서 얼마나 많은 다음 세대의 로봇이 생산되는지는 문제가 되지 않는다. 다만 컴퓨터로 나타난 환경에서 그들의 성능만이 고려될 뿐이다. 만약 많은 세대 후에 컴퓨터 환경에서 놀랄만큼 잘 적응하는 슈퍼 로봇이 나타날 경우, 실제 환 경에서는 어떤지는 컴퓨터 모의실험 환경이 실세계를 얼마나 잘 재현하는가에 달려 있다. 진화 로봇학에서 특히 흥미로운 요소는 하나의 자손을 생산하기 위해 투입되는 로봇의 수 이다. 몇몇 로봇의 유전자는 서로 혼합하여 다음 세대의 로봇을 생산할 수 있다. 벤 gpt은 이를 '사이버 섹스(cyber sex)라 부른다. 현재까지는 이것이 좋은 특징인지 나쁜 특징인지 알려진 바가 없다. 브리티쉬 텔레컴(British Telecom)에 있는 친구, 피터 콕란(Peter Cochrane)은 실제 세계의 포유동물은 성적 재생산을 위해 적절한 수인 둘로 귀착되었고, 그 래서 아마도 이 숫자는 좋은 의미가 있을 거라는 사실을 지적했다. 그러나 특히 로봇에 대 해서는 둘로 제한하는 것이 어느 정도 명백한 이유가 없는 한, 모의실험상에서 성적 재생산 에 대하여 적용할 필요가 있는지 확신할 수 없다. 진화 로봇학을 진행할 뿐만 아니라, 우리는 6각 보행 로봇에 대한 프로그램 또한 추진하 여 왔다. 인공 두뇌학과 연구원인 랙페이틀(Rax Patel)은 월터를 일으키고 걷게 하는 일을 주로 담당했다. 그리고 다른 연구원인 대런 웬(Darren Wenn)은 주로 엘마를 담당했다. 엘마는 8장에서 다뤄졌다. 엘마에 대해 우리가 가졌던 계획이 무엇인지는 밝힐 만한 가치 가 있다. 우리가 실제로 얻고자 한 것은 엘마가 시행착오를 거쳐 걸음을 학습하게 하는 것 이었다. 실제로 엘마는 이와 같은 식으로 구성되었다. 지금까지 대부분의 보행 로봇 기계들의 경우. 각 다리를 동작시키기 위해서는 단순히 전 기 모터나 유압 모터에 신호를 보내는 것으로 충분했다. 월터는 이보다 한 단계 더 발전해 서 각각의 다리에 스스로를 돌볼 수 있는 국부적인 지능을 가지도록 했다. 그러나 이와는 별도로 로봇을 걷게 할 수 있는 각 다리의 동작과 조화된 동작들의 움직임은 미리 정해졌 다. 엘마를 위한 계획은 신경 회로망을 통하여, 그 전과는 다른 다리 동작을 시도함으로써 넘 어가지 않도록 다리 동작을 배우는 것이다. 또한 엘마는 다리가 땅을 밀 때 이를 감지하는 센서를 가지고 있기 때문에, 로봇이 울퉁불퉁한 땅을 걷게 하기 위해서 상당한 수학적 기법 을 사용할 수 있다. 엘마가 자신의 두뇌를 사용해서 걷는 것을 학습하면, 울퉁불퉁한 땅과 기묘하게 생긴 물체와 그 외의 것을 극복하면서 학습하는 것이 가능할 것이다. 땅 위에서 엘마의 몸을 유지하도록 학습하는 일이 얼마나 쉬운지 살펴보는 것 역시 흥미로울 것이다. 엘마는 짐승 또는 곤충의 보행 방식이 아닌 다른 방식의 걸음걸이를 얻게 될 것이다. 우리 는 앞으로 볼 것이다! 모든 로봇의 경우, 어떠한 형태의 학습을 수반하면서, 특정한 상황에서는 우리의 동물과 곤충의 세계에 대한 지식을 통하여 기대하는 대로 학습하나, 시간이 경과하면서 우리가 기 대하지 않았던 방법으로 사물을 학습하는 것은 흥미롭다. 이 단계에서 각 로봇의 신경 회로 망과 이에 관련된 학습 과정은 분석하지 못할 정도로 어렵지는 않으므로, 우리는 특별한 특 성을 학습하는 로봇의 경우에 대하여 그럴 듯한 이유를 제안할 수 있다. 로봇의 물리적 속성과 로봇이 학습하고 있는 것 사이에는 대게 직접적인 연관이 있다. 인 간으로서 우리는 인간의 가치를 통하여 문제를 직시하고, 눈과 코 같은 인간의 센서를 통하 여 상황을 살핀다. 그러나 로봇이 사물을 어느 정도 감지할 수 있는지, 그것의 목표가 무엇 인지, 그리고 어떤 선택이 되는지 살펴보는 동안 로봇이 특정한 행동이나 반응을 학습해 온 이유가 곧 밝혀질 것이다. 로봇이 학습하는 방법을 연구함으로써 학습 과정에서 무엇이 중요하고 그렇지 않은지, 특 징을 학습하기 위해서 어떤 정보가 필요한지 분명해질 수 있다. 이것은 인간이나 다른 포유 동물, 그리고 곤충의 행동을 어떻게 보아야 할지에 대하여 즉각적인 영향을 줄 수 있다. 요 즘 우리들은 로봇의 학습 과정을 임의로 수정할 수도 있으며, 다소 자극적인 환경을 제공할 수도 있고, 센서 혹은 더 많은 정보를 추가할 수도 있다. 어쩌면 가장 중요할 수 있는, 수분 동안에 로봇의 모든 학습 과정을 입증할 수도 있다. 이것으로부터 기계 심리학(machine psychology)이라고 하는 매혹적이고 새로운 연구 분야가 시작되었으며, 이를 통해 우리는 당면 과제와 그들의 환경에 대한 꽤 엄격한 통제 방식을 이해하고, 그뿐 아니라 그들의 두 뇌를 열어서 왜 그런 식으로 행동하는지 이해할 수 있게 되었다. 우리는 지금까지 수행해 온 연구를 통해서 직접적으로 관찰한 사실은 우리 안에 내재된 모든 행동 양식이 기계나 비기계 모두 비슷하게 매우 기본적인 반응으로 나타난다는 것이 다. 단순한 생존 본능이 나타나거나, 식욕 또는 쾌락과 같은 기본적인 욕구 충족성 보상이 인간이건 로봇이건 그들을 움직이는 추진력이 된다. 우리는 로봇에서는 이러한 본능이 약탈자를 피하거나 재충전을 위해서 움직여 가는 것으 로 나타났다. 더 기본적인 욕구에 대한 반응이 다른 어떤 물질적 보상을 줄 수 있는 대리물 을 압도하는 것은 당연하다. 예로서 두 주 동안 뜨거운 사막에 있은 후에, 1갤런의 시원한 음료수, 백만 파운드, 또는 시간 여행 장치 중에 어떤 것을 고르겠는가? 지금까지의 우리는 기계 심리학을 통하여 어떤 상황에서도 행동에 있어서 중요하고 기본 적인 피드백이 무엇인지 면밀히 살펴보게 되었다. 파블로프(Pavlov)의 개들이 침을 흘린 이 유가 그들이 간간이 들리는 종소리를 마음 깊이 즐겼기 때문이 아니라 종이 울릴 때마다 습 관적으로 음식을 생각했기 때문이다. 최근에 나는 어린이의 학습을 주제로 다른 텔레비전 프로그램을 보았다. 세네 살의 어린 이에게 초콜릿 상자를 보여준 다음에 '상자 속에 무엇이 있냐?'고 물었다. 초콜릿 상자에는 실제로 연필이 있다는 사실을 알려주기 위해 상자를 열어 보였다. 어린이에게 '이것이 무엇 이냐?'라는 질문을 하니 어린이는 '연필'이라고 대답했다. 그러고는 어린이에게 '상자를 열기 전에 무엇이 있을 것 같았니?'하고 물었다. 이 질문에 어린이는 '연필'이라고 답했다. 이 프로그램에 의한 결론은 어린이가 아직까지 질문을 이해할 정도의 언어를 충분하게 터 득하지 못해서 '틀린' 답을 했다는 것이다. 내 생각으로는 그 대답은 언어를 이해하지 못해 서라기보다는 상당히 기본적인 욕구에 대한 반응이며, 어른이 듣기 원했던 것에 대한 어린 이의 솔직하고도 최선의 추측일 뿐이다. 어린이는 '그래', 또는 '잘했어'라는 형태의 보상을 바라고 있었던 것이다. 탁자 위의 약 10개의 연필에 대해서 '연필'이라는 단어를 여러 차례 알려 주고, '미국의 대통령이 누구니?'라고 물으면 어린이는 아마 '연필'이라고 답할 것이다. 어린이와 파블로프의 개들은 유사하지 않다. 로봇의 경우 한 로봇이 다른 로봇을 다루는 방식에서 각 로봇의 특징이 어느 정도 영향을 주는가를 살펴보는 것은 흥미롭다. 나는 앞에서 일곱 난쟁이의 무리 중 하나가 추운 방에 있어서 약하게 보일 때 무리로부터 괴롭힘이 계속되는 것을 언급했다. 그 결과로 로봇이 더 욱 약해지고 아무 것도 할 수 없을 정도로 쇠약해져 죽은 상태가 되면, 신호보내는 것을 모 두 멈출 것이다. 이 단계에서 다른 로봇은 이를 무시하고 죽은 것으로 간주해 버린다. 그러 나 이러한 분석은 모두 인간의 가치에 의한 것이다. 로봇들이 약한 로봇을 괴롭히는 것이라 고 생각하면서도 반면에 우리는 인간적 가치를 적용해서 약한 로봇을 보살피며, 그들이 약 한 로봇에 대한 지원을 호소하는 듯이 볼 수도 있겠다. 그러나 실제적으로 발생하는 일은 일곱 난쟁이가 그들의 기본적인 행동 방식인 적외선 신 호를 통하여 함께 모인다는 것이다. 여러 로봇중 한 로봇이 약간 상태가 좋지 못해서 움직 이지 못하면 다른 로봇들은 그들의 지도자격 로봇이 약한 로봇을 남겨두고, 나머지를 데리 고가지 않은 한 약한 로봇이 있는 장소로 모여들려 한다. 만일 이 로봇으로부터 신호가 전 혀 나오지 않으면, 다른 로봇들은 단순히 무시하거나 벽 또는 상자와 같은 다른 물체로 다 루게 된다. 근본적으로 그들은 더 나은 방법을 모른다. 그러나 이러한 것을 인간의 행동과 연관시킬 수 있을까? 물론 인간은 다른 약한 인간을 거들떠 보지 않거나 죽은 사람을 방치하지는 않는다. 그러나 우리가 길거리에 누워 있는 죽 은 사람을 보지 못한다면, 그 사람이 그곳에 있는지 알 방법은 없다. 이러한 식으로 말했던 사람이 철학자 버클리(Berkeley)가 아니었던가? 일단은 죽은 사람이 있는지 없는지를 아는 것이 중요하다. 우리가 그를 보지 못하고 후각이나 다른 감각을 통해서도 그를 발견하지 못 한다면, 우리는 그가 거기 있다는 것을 알 수 없다. 로봇의 경우에도 마찬가지다. 다양한 방식으로도 죽은 로봇들을 감지할 수 없다면, 어떻게 거기 있다는 것을 알 것인가? 죽은 로봇이 살아 있었을 때 적외선 신호를 보냈고, 각각의 로봇이 상당히 좋은 기억력을 가졌다면, 그 로봇이 과거에는 살아 있었다는 것을 알 수는 있다. 이 경우에는 적외선 신호의 감지 여부에 따라 상대의 생사를 판단하는 개념이 필요할 지도 모른다. 우리 자신이 각각의 방식에 따라 신체와 정신적인 능력을 기초로 하는 판단하는 것처럼 인간의 가치를 통하여 기계의 행동과 특성을 살펴보는 것도 나쁘지 않다. 버클리 연구의 주 된 특징은 '세계는 마음이 지각하는 것에 따라 존재한다'라고 할 수 있다. 각각의 개인은 그 들이 이해할 수 있는 세계에 대하여 그 사람의 지각을 통해서 응답한다. 시각 장애인의 세 계는 정상 시각을 가진 사람의 세계와는 상당히 다르다. 버클리의 철학은 인간에 대해서 성 립하는 것처럼 기계나 다른 동물에게도 동등하게 성립한다. '기계의 세계는 기계의 두뇌가 지각하는 것에 따라 존재한다.' 이말은 컴퓨터와 로봇내지 다른 기계를 다루는 모든 사람들에게 절대적으로 중요한 것이 다. 로봇의 행동 연구에서 결론을 내리면 다음과 같다. 로봇은 인간이나 동물처럼 다른 로봇 을 도울 수 있다. 그러나 이것은 인간이 아닌 로봇에 대한 실험이므로 로봇의 행동에 대해 다양한 의견이 나올 수 있다. 이때는 인간이 자신에게 상대적인 가치를 사용하듯 로봇의 행 동도 로봇의 관점에서 보아야 할 것이다. 로봇이 학습하고 환경에 반응하는 방법은 지금까지 우리가 해왔던 것보다 훨씬 다양하게 연구될 수 있다. 예를 들어, 학생 로봇이 선생 로봇의 정보와 자신의 경험을 섞는 방법이나 학생 로봇이 자신의 경험을 얼마나 빠르고 강하게 신뢰하냐는 것이다. 로봇에게 주어진 특징과 능력이 많아지면서, 각각에 대해 우선 순위를 정하는 것도 필요 하다. 특별한 학습 습관과 특성은 연구되고 비교될 수 있다. 그 중에 하나는 초기의 학습이 완료된 후에 로봇의 학습이 얼마나 능동적일 수 있느냐는 것이다. 각각의 학습 특성을 연구하는 것도 흥미롭지만, 독립된 일곱 난쟁이 로봇이 서로 통신하 며 상호 작용을 학습하도록 연구하는 것도 흥미롭다. 로봇들은 서로가 물리적 특성은 조금 씩 다르지만 통신만큼은 모두 적외선 신호를 사용하고 있다. 앞으로 두 가지가 개선되어야 한다. 첫째, 로봇간에 좀더 물리적인 차이가 필요하다. 이는 집게를 장착하고 겹눈을 달아줌으로써 해결되었다. 겹눈을 다는 것은 동시에 로봇의 두뇌도 물리적으로 달라질 것이라는 점에서 특히 유용하다. 둘째, 로봇의 통신 형태를 훨씬 더 유연 하게 만들 수 있도록 해야 한다. 개인들 사이의 통신은 상당히 중요하며 특히 기계에 있어서 그 잠재력이란 엄청나다. 인 간은 기계간의 통신 능력과 비교해보면 상대적으로 미약한 통신 기술을 가지고 있다. 실제 로 우리는 통신을 위해 기계를 사용한다. 신속한 해법을 얻기 위해 통신 채널과 통신 범위 를 제한한다 할지라도, 기계 상호간의 통신에 대해 학습 능력을 부여하는 것은 상당히 흥미 롭다. 심지어 우리 로봇의 적외선 통신을 제한한다 하더라도, 어느 정도 결과는 얻을 수 있다. 각 로봇은 어떤 범위의 신호들을 송신함과 동시에 다른 로봇으로부터 신호를 수신한다. 그 들은 특정 주파수로 신호를 수신하고 응답한다. 통신하는 로봇을 학습시키는 방법의 핵심은, 다른 학습처럼 좋은 방법으로 통신하고 있을 때 보상을 주는 것이다. 학생 로봇이 선생 로봇으로부터 받은 신호를 통해 다른 것에 부딪치지 않으면서 주위를 움직이는 방법을 학습할 수 있듯이, 선생 로봇도 학생 로봇이 보낸 신호를 통해 학생 로봇 이 처한 상황과 그 상황에서 무엇을 하고 있는지 알 수 있다. 선생이 명령을 보내는 데 이 용하는 무선 통신을 통해서, 선생은 학생의 상황과 응답에 관련된 정보를 받을 수 있다. 학 생인 그가 처한 상태에 대응하는 적외선 신호를 주파수가 더 높아야 하는지 낮아야 하는지, 혹은 신호 배열이 바른지 틀린지를 응답 신호로 보낸다. 로봇의 통신 능력이 확대되면서, 로 봇 상호간의 통신 학습과 함께 통신하는 정보의 범위도 다양해지고 있다. 간단한 예로, 만약 로봇이 집게를 가지고 있으면, 집게가 열렸는지 닫혔는지, 또는 물체가 미끄러지고 있는지 등과 관련된 신호를 송신하지 못할 이유는 없다. 초기에 신호의 정류를 선택해서 특별한 신호의 의미를 학습하라고 다른 로봇에게 요구할 수 있다. 다른 로봇들도 집게의 개폐에 대한 정보를 얻을 수 있는 한 이러한 것을 못할 이유가 없 다. 그렇지만 기억하라. 버클리의 철학에 의하면 로봇은 상대 로봇의 집게가 실제로 사용됐 는지를 알 필요는 없다. 그들은 자신들에게 주고 있는 영향만 알면 된다. 비록 처음 순간에 는 상당히 간단하더라도, 둘 이상의 로봇이 무엇인가를 가리키기 위해 동일한 신호를 사용 하면 학습이 불가능하다. 로봇들이 신호의 의미가 바뀌는 것을 인식할 수 있다면, 한 로봇이 지도자가 될 때 신호를 새롭게 정의하는 것도 가능하다. 지도자의 신호 변경 능력과 새로운 의미를 갖는 새로운 신호를 만드는 능력, 더불어 학생 로봇이 통신 방법을 학습할 가능성이 있다면 로봇이 자신들의 언어를 만들어 낼 수도 있을 것이다. 실험실의 일곱 난쟁이 로봇에 대하여, 우리는 그 가능성을 검토할 수 있다. 통신이 가능한 범위, 신호를 보내는 형태와 학습하고 신호를 변화하는 데 허용되는 유연성, 새로운 신호가 도입될 수 있는 범위와 내용, 즉 신호가 무엇을 의미하는지에 대하여 우리는 엄격히 정의할 수 있다. 로봇이 한동안 느슨하게 동작하는대로 방치한 후에, 우리는 로봇이 상호간에 무엇 을 말하는지 이해하지 못하게 되었다. 그러나 한동안 로복들을 자세히 살펴보아서 그들의 통신 범위를 알아앰으로써 우리는 로봇이 말하는 바를 이해할 수 있었다. 이것은 우리가 외 국어를 배우는 것과 본질적으로 동일하다. 우리 연구실에 있는 작고 친근한 로봇들에게서 알 수 있는 사실은 처음에는 우리도 이해 할 수 없는 언어로 의사 소통하는 법을 배우는 것이 물리적으로 상당히 가능하다는 것이다. 우리가 그들이 사용하는 통신 신호의 범위와 형태에 대하여 모두 잘 안다면 문제될 것이 없 다. 기계를 엄밀히 파악하지 않은 환경에서는 기계가 우리도 이해하지 못하는 언어로 의사 소 통을 배우는 것이 사실상 가능하다. 더 나아가 그들이 통신하는 내용과 환경을 자세히 알지 못한다면 그들을 이해하는 것이 더 어려워질 것이다. 실험실의 작은 로봇에 대하여 우리는 상당히 걱정스러운 면을 경험할 수 있었다. 그러므로 다가올 미래에는 어떤 연구가 전개될 것인가? 한 가지 주제는 '고쳐 배우는 것'(unlearnini)으로서 망각하는 것과 뚜렷이 구분된다. 일곱 난쟁이 로봇 중 하나가 우리 주 위를 어떻게 움직여야 할 지 학습할 때는 어느 일정한 환경에 대하여 여러 가지 방법을 시 행한다. 로봇이 행동을 배울 때 방법이 좀 이상하고 부분적으로 유용하지 않더라도 초기에 는 상당히 상하게 행동을 유지하려고 한다. 로봇은 그것을 잊지 않으려고 한다. 우리가 그 행동을 이상하고 바람직하지 않다고 여긴다면, 그런 행동은 고쳐질 수 있다. 그러면 어떻게 고칠까? 로봇이 이런 행위를 고치는 법을 살펴보면, 그 방법은 인간에게도 또 한 유용할지 모른다. 고쳐 배우는 절차 중에 하나는 단순한 세뇌이다. 그것은 단지 의사 무작위 정렬로 로봇의 두뇌를 초기화하는 것이다. 그 후에 로봇은 처음부터 다시 학습해야 한다. 초기에는 이상한 행동을 보이지 않지만, 나중에 독특한 특성을 나타낼 수 있다. 인간의 경우에 있어서 완전한 세뇌라는 것이 실제로는 상상하기 힘들 뿐만 아니라, 내가 생각하기에도 크게 환dud 받을 만한 일이 아니다. 그러나 로봇의 두뇌에서 이런 비정상적 특성과 관련된 뉴런 시냅스의 위치를 파악할수만 있다면 전체를 세뇌할 필요없이 두뇌의 작은 그 영역만 학습하면 된다. 국부 학습 활동이 짧은 기간 동안에는 로봇 두뇌의 일부 영역에 어느 정도 영향을 줄지 모르지만, 긴 안목으 로 보면 이미 고쳐 배운 행동을 또다시 이상한 행동으로 여겨서 다시 배울 가능성은 거의 없다. 동일한 환경이 어떤 또다른 순서로 나타나지 않는한 거의 없다고 할 수 있다. 특히 대안이 인간의 신경외과학에서 발견 될 수 있는지, 그 가능성을 조사하는 것은 확실 히 가치 있다. 처음에 언급했던 대로 간질의 경우, 신경외과학은 효과적인 치료를 하지 못했 다. 간질이 있는 사람의 대부분은 행동을 억압하는 효과가 있는 약을 복용했다. 그러나 약의 효과가 없는 더 많은 사람들은 대처할 방법이 없다. 심한 경우 경련이 일어나기까지 하며, 그 밖에도 다른 신경 문제들이 발생한다. 나의 부친은 일하러 가기가 힘들 정도로 심한 광장공포증(廣場恐怖症: agoraphobia)을 가 지고 있었다. 점점 악화되는 병세로 인해 마침내 신경외과적 수술을 받았다. 그 당시 나는 아홉 살이어서 스메스윅(Smethwick)병원의 외과 의사가 두뇌의 특정 부분을 수술함으로써 증상을 완화시킨 것 외에는 무슨 일이 있었는지 기억에 없다. 처음에 아버지는 가끔 집 앞 에 서서 주머니에 손을 넣고 걸어가는 사람에게 소리치는 등 때때로 날카로운 기질을 보이 기는 했지만, 상당히 짧은 요양 기간 후 아버지는 평범하게 집 밖을 나갈 수 있었다. 인공 두뇌가 어떻게 동작하는지 심도 있게 연구하여 로봇이든 아니든 우리가 산경계에 문 제가 있는 사람을 도울 수 있다면, 특히 신경외과적 질환을 치유하기 위해 계속해서 약을 먹어야 하는 사람들에게 대안을 제시할 수 있다면 상당히 가치 있을 것이다. 연구의 다른 방향은 로봇의 적합한 인공 신경 회로망 방식을 연구하는 것이다. 앞에서 나 타난 대로, 우리는 문제에 대해서 거대한 신경 회로망이나 계산력을 투자하는 대신에 각 문 제에 대해서 합리적인 회로망의 크기와 형태를 사용한다. 로봇에 좀 더 많은 특징이 추가되 었을 때, 부가적인 두뇌의 부위가 이를 다루기 위해서 첨가될 것이다. 이것은 일곱 난쟁이 로봇들이 상당히 효율적인 두뇌를 가진다는 것을 의미한다. 우리는 인간 두뇌의 각 부분이 각기 다른 특징을 담당하고 있다는 사실을 알고 있다. 그 런 부분들은 모두 물리적으로 밀접하게 연결되어 있다. 그래서 일곱 난쟁이 로봇도 인간 두 뇌의 구조와 동작처럼 신경의 관점에서 아래에서부터 거꾸로 상승 효과를 노리는 것이다. 밀접하게 연결되어 있으면서 동작의 관점에서는 분할된 두뇌를 만드는 것을 연구하고 있다. 나의 관점은 자연적인 분할이 현재 쓰이는 강압적인 방법보다 더 효율적일 수 있다는 것이 다. 다시말해 엄격하게 분할하는 것보다 느슨한 분할을 한 로봇 두뇌에 관심을 갖을 필요가 있다. 두뇌의 크기와 연결성의 전반적인 문제는 벌과 그들의 협동력에 대한 초기의 논의로 귀착 된다. 하나의 벌떼는 실제로 여러개로 분할된 한 개의 두뇌를 가지고 있고, 감각의 벌의 두 뇌가 전체뇌의 한 부분이 된다고 할 수 있다. 그러나 각 벌의 두뇌는 같은 일을 하고 상당 히 비슷하게 동작한다. 그래서 각각의 작은 분할 요소라 볼 수 있는 각 벌의 두뇌는 매우 유사한 일을 하고 있기 때문에, 비록 떼지어 있는 많은 벌들에게는 어느 정도 이득이 있겠 지만, 전체적으로는 한계가 될 수도 있다. 인간의 두뇌는 벌의 두뇌에 비하여 크나, 뉴런의 수에 있어서는 수백만 개의 벌의 두뇌와 비슷하다. 그러나 인간의 두뇌는 각기 다른 것을 다루는 개략적으로 분할된 영역을 갖는 하 나의 기관으로 동작한다. 만약 인간의 두뇌가 수천개의 작은 부분으로 분할되어 있고, 각각 은 상대적이고 독립적으로 동작하면서도 상당히 비슷한 일을 한다면, 인간은 아마 벌떼의 기능을 갖게 되고 더 나은 것이 없을 것이다. 현재 기술적으로 가능한 것을 살펴봄으로써, 경계하여야 할 것을 강조하면서 이 장을 끝 내고자 한다. 우리는 레딩에서 지능 기계에 대하여 연구하는 멋있고 친근한 사람들이다. 그 러나 우리처럼 친근하지 않으며 개방되어 있지도 않고, 우리보다 더 많은 돈을 쓰면서도 그 들이 하는 일에 일언반구도 없다면, 그러한 사람들에게 무슨 희망이란 것이 있겠는가? 앞에서 언급한 바와 같이, 우리는 바퀴로 주위를 돌아 다니는 1.5m 높이의 로봇을 가지고 있다. 일곱 난쟁이 로봇의 하나로 매우 큰 버전이다. 화재와 같은 극도의 고열에 견디는 적 외선 감지기를 가지고 있다. 화재 진압용 노즐도 가지고 있다. 그리고 불을 끄기 위하셔 불 쪽으로 향할 수 있다. 따라서, 이 로봇의 전반적인 용도는 매우 긍정적이다. 어떤 지시없이 건물 주위를 이리저리 다니며 보이는 불을 순간적으로 끌 수 있다. 이것은 인간을 위험한 작업에서 벗어나게 한다. 그러나 무엇이 그렇게 할 수 있을까? 현재 무엇이 기술적으로 가능할까? 적외선 센서를 통하여 불을 감지하는 대신에, 8장에서 기술한 바와 같이 로봇은 카메라를 기반으로 한 시 각 시스템을 사용함으로써 가능하게 될 수 있다. 시각 시스템을 신경 회로망과 연결함으로 써, 회로망은 웃는 얼굴 또는 화난 얼굴을 인식하거나 훈련될 수 있다. 소화기 대신에 로봇 은 기관총을 가질 수 있다. 건물 주위를 이리저리 다니며 화재를 살피는 대신, 안경을 끼거 나 금발의 머리나 심지어 특정한 사람을 찾을 수 있다. 지금까지 로봇은 희끗희끗한 머리를 금발로 간주하기는 하였다. 그들을 발견했을 때 무엇을 할 수 있는가? 그들을 쏘거나 적어 도 앞에서 언급한 차림새와 비슷한 사람을 쏘거나, 그렇지 않으면 다른 사람을 쏠 수도 있 다. 실제로 이런 극도로 위험한 일이 일어날 것인가? 물론 그렇지 않다. 어느 누구도 -레딩에게는 확실히- 현재 기술적으로 가능하더라도 그러한 것을 실제로 만 들기를 원하는 사람은 없을 것이다. 또 염려되는 것은 로봇의 삶의 목표가 단순히 뭔가 찾아서 파괴하는 것이라면 그렇게 할 수도 있다는 점이다. 로봇은 사냥감을 찾을 때까지 계속 찾아다닐 것이다. 물론, 때로는 전 지를 충전하러 가야 한다. 그러나 그것은 문제가 아니다. 게다가 로봇은 쉽게 자신의 목표물 을 학습할 수 있다. 금발을 한 사람이 사냥감이라고 학습하거나, 사람 또는 사람과 비슷한 것은 자신의 스위치를 꺼서 동작을 정지시킬 수 있기 때문에 반드시 없애야 한다는지 하는 것을 배울 수 있다. 만약 로봇이 웃는 얼굴 쪽으로 움직이는 것을 학습할 수 있다면, 기관총을 가진 로봇이 스위치를 끄려고 하는 사람을 쏘는 법을 배우는데에 어려움이 없을 것이다. 그것은 로봇이 알아야 할 사항이 다음 두 가지면 충분하기 때문이다. 즉, 먼저 스위치가 꺼지는 것은 부정 적인 일이며 어떻게 해서든 피해야 한다. 다음으로 스위치가 꺼지지 않기 위해서 물리적으 로 무슨 일인가 해야 한다. 이러한 로봇이 하나일 필요는 없다. 여러 대가 이러한 특징을 갖게 할 수 있다. 그들은 우 리가 이해하지 못하는 언어로 통신할 수 있다. 그러나 그들은 바퀴로 움직이므로 밖으로 돌 아다닐 수 없고 계단을 오를 수 없기 때문에, 우리는 걱정할 필요가 없을지 모른다. 자, 차분히 따져 보자. 건물 안에서 위건 아래건 가기 위해서 계단으로 갔다. 그러나 로봇 은 상호 통신이 가능하기 때문에 우리가 어디를 가든 거기에 있을 것이다. 내가 보행 로봇 에 대하여 어떤 곳에서도 들어 본 적이 없지만 말이다. 나중에 보게 되겠지만, 우리는 빌딩 전체를 지능 로봇으로 간주할 수도 있다. 그러나 비록 기술적으로 가능하다 하더라도 이러한 로봇을 만들기를 원하는 사람은 아무 도 없을 것이다. 왜 원하지 않을까? 그 사람은 도시 전체를 날려버릴 수 있는 원자폭탄을 만드는 사람이나 다름없기 때문이다.