[심리학개론] Lec 06 - 학습
[심리학개론] Lec 06 - 학습
Precaution
서울대학교 박승진 교수님의
심리학개론
22-1 의 Lecture note 입니다.
1. 학습의 정의
- 학습의 정의 : 유기체의 행동에 변화를 낳는 여러 기법, 절차 및 결과들의 묶음.
- 학습에서의 강조점 : 경험에 기초, 유기체에 변화를 낳음. 비교적 영속적임.
- 많은 부분은 행동주의자들에 의해 만들어짐
- 학습 과정을 이해하기 위해서는 인지적 과정에 의한 고찰이 필요.
2. 고전적 조건형성 (반응적 조건형성)
- Ivan Pavlov (파블로프, 개의 타액분비 실험)
- 먹이가 없는데도 개가 침을 흘림 (먹이 + 종소리)가 짝지어짐.
- 먹이 (무조건 자극(US) : 무조건 침을 흘리게 만드는 먹이)
- 침 흘림 (무조건 반응(UR) : 먹이이를 주면 자동으로 침을 흘림)
- 종소리 (조건 자극(CS) : 처음에는 침을 흘리지 않음)
- 고전적 조건형성 (Classical conditioning)
- 먹이와 종소리가 연합되면 조건 반응(CR) 침을 흘림, 즉 무조건 자극과 조건 자극을 동시에 주면 (연합시키면), 조건 자극만으로도 조건 반응이 형성됨.
- 획득
- 무조건 자극과 조건 자극이 함께 제시되는 고전적 조건형성 기간. (획득기간)
- 초기에는 학습의 정도가 급격히 올라가다 점차 줄어드는 양상.
- 이차 조건 형성
- 이전 조건형성 절차에서 US와 연합되었던 CS를 다른 CS와 연합시키는 것.
- 종소리 전 검은 사각형을 보여주면, 검은 사각형만 보아도 침을 흘리게 됨.
- 우리는 돈에 왜 집착하는가? 이차적 조건형성으로 인해 학습, 돈 -> 즐거움으로 착각.
- 소거와 자발적 회복
- 소거 : 무조건 자극이 아닌 조건 자극만을 계속 주어질 경우, 학습된 반응이 제거됨.
- 자발적 회복 : 휴지기간 이후 갑자기 조건 자극을 주면, 다시 침을 흘리게 됨. ex) 알코올,도박 중독 등에서 회복된 사람 -> 갑자기 자발적 회복이 일어날 수 있음.
- 일반화와 변별
- 일반화 : 원래의 조건형성에서 제시되는 CS 와 약간 다른 자극이 주어져도 CR이 관찰됨.
- 변별 : CS와 유사하지만 별개인 자극에 대해서는 CR의 강도가 줄어들거나 사라짐.
- 잘 표현한 속담 : 자라 보고 놀란 가슴 솥뚜껑 보고 놀란다.
- 변별이 어려워지면 짜증이 나거나 신경질적 반응. (부모가 아이가 변별 잘 할 수 있도록 도와야함)
- 조건형성된 정서 반응 : Little Albert(행동주의 심리학자 John B Watson)
- 무조건 자극 : 큰 소리 / 무조건 반응 : 놀람, 공포감.
- “둔감하고 감정의 변화가 없는” Abert에게 공포를 학습하려 한 Watson
- 처음에는 흰 쥐에 대해 공포가 없었으나, 큰 소리라는 US에 흰 쥐라는 CS를 연합시켜 쥐에 대한 공포 (CR)을 학습시킴.
- 나중에는 흰 쥐 말고도 흰 토끼, 바다 표범, 산타클로스 등에게도 공포를 나타내는 자극 일반화를 보임.
- 비교적 복잡한 반응도 조컨 형성.
- 왜 어린 아이? 공포증? - 프로이트의 이론을 꺠기 위한. 프로이트의 주장처럼 그러한 반응의 근원에 무의식이나 인생 초기 경험이 필요한 것은 아니라는 반론 제기.
- 안나 오, 리틀 안스 (프로이트의 환자, 말에 대한 공포)
- 여러 가지 문제점 : 도덕적으로 아이에게 공포를 학습시키는 것이 맞나? 공포를 조건형성시켰다면, 공포스럽지 않은 것을 이용해 쥐에 대한 공포 해소를 할 수 있지 않았나, 성급한 일반화 (정교하지 않은 실험)
- 고전적 조건 형성에서의 인지적 요소 (행동주의자들은 인지적 요소를 싫어함.)
- 인지적 요소가 개입함을 점차 인정하게 됨.
- “파블로프의 개는 왜 조수가 올 떄는 침을 흘리고, 파블로프가 올 떄는 흘리지 않는가?”
- 동물 역시 기대를 설정하는 법을 배울 때에만 조건 형성이 일어남
- 조건 자극을 통해 음식에 대한 기대를 하게 되고, 이로 인해 반응이 일어나게 됨.
- 낯선 자극이 조건 형성이 잘 됨. (친숙하지 않은 사건일 있을때 -> 기대라는 요소를 도입.)
- 친숙한 도구는 이미 기대가 형성되어 있기 때문에 잘 조건형성 되지 않음.
- 고전적 조건형성이라고 해서 원시적이고 자각이 없는 과정이 아님. (기대라는 인지적 요소가 들어있음.) 그러나 이 기대도 의식적일 필요는 없음.
- 고전적 조건형성에서 신경적 요소
- 공기 뿜기(US) 와 눈 깜빡임(UR) 사이에 소리(CS)를 조건형성할 때 소뇌가 중요 역할을 차지.
- 약한 전기충격(US) 와 얼어붙기 및 자율신경계 반응(UR) 사이에 소리(CS)를 조건형성 할 때는 편도체가 중요 역할을 함.
- 조건 형성에 따라 그 조건의 특성에 따라 작용하는 뇌의 부위가 다름.
- 고전적 조건형성에서의 진화적 요소
- CS와 US가 여러번 연합되지 않아도 조건형성까지 오랜 시간이 흘러도 강력히 학습될 수 있음: 음식 혐오 (주로 CS는 후각이나 미각 자극)
- 음식을 먹은 후 배탈이 나기까지 오랜시간(몇시간)이 걸림에도 불구하고 학습이 이루어짐.
- 생존에 굉장히 중요한 요소이므로 한번의 자극으로도 조건형성이 이루어지게 됨.
- 아주 일상적인 음식에 대한 조건 형성이 이루어지지는 않음. (냄새가 강하거나 평소에 잘 먹지 않는 음식에 대해.)
- 화학요법이나 방사선 치료(US)를 받은 암 환자는 무조건 토하게 됨(UR) - 치료 전 먹은 음식에 대한 혐오를 느낌.
- 새는 음식을 찾을 떄 시각에 의존 -> 후각과 미각보다는 시각 자극으로 CS를 사용하는 것이 음식 혐오 생성에 유리 (이러한 측면이 진화적 요소라고 볼 수 있음)
3. 조작적 조건 형성
- 고전적 조건형성과 조작적 조건형성의 차이
- 고전적 조건형성은 자극과 반응(행동)관의 관계에 대한 설명
- 자극에 대한 반응은 비자발적 행동이며, 동물 행동의 일부만을 설명할 수 있음.
- 행동과 행동의 결과의 관계에 대한 설명 (행동의 결과에 따라 그 행동이 증가 혹은 감소할 수 있음)
- 조작적 조건형성으로 동물의 능동적 행동을 설명할 수 있음.
- 조작적 조건형성의 발달
- Thorndike의 실험(1898)
- 우연히 문제상자 안의 지렛대를 눌러서 먹이를 먹은 고양이
- 효과의 법칙 : 어떤 행동을 했을 때 만족스러운 사태가 뒤따르는 행동은 반복되는 경향. 반대로 불쾌한 사태를 낳는 것들은 되풀이 될 가능성이 적음.
- 파블로프 실험보다 선행.
- B. F. Skinnere
- 왓슨의 행동주의 책에 감명 받음.
- 소설은 포기하고 심리학 대학원에 진학. 말년에 작성한 소설책 : Walden(헨리 데이비드 소로) - 월든 2 : 이상적인 삶, 유토피아에 대한 생각.
- 스키너 박스 : 쥐, 비둘기 관찰, 레버, 음식, 전기 자극 등.
- 조작 행동 : 환경에 어떤 영향을 주는, 유기체가 생성하는 행동
- 강화 (reinforcement) : 어떤 행동을 습득하게 하고 그 빈도를 증가시키는 과정
- 처벌 (punishment) : 강화와 반대로 어떤 행동을 소거하거나 빈도를 감소시킴.
- 어떤 자극이 제시되는 상황은 정적(positive)
- 어떤 것이 제거되는 상황이 부적(negative)
- 강화와 처벌
- 정적 강화 : 긍정적 보상을 제공하는 방법으로 강화 (아동이 좋아하는 사탕 주는 것으로 심부름 강화)
- 부적 강화 : 혐오적 고통을 제거하는 방법으로 강화 (아동이 싫어하는 숙제를 면제해주는 것으로 심부름 강화) - 발표 안하는 것, 소개팅 안하는 것? 부적 강화에 의해 움직이는 사람? 고통을 피하기 위해 행동하는 것이 좋지 않을 수 있음 (사회 공포증, 사회 불안증) - 자해 : 부적 강화의 과정. (다른 고통을 잠시 잊게 해주기 때문에.)
- 정적 처벌 : 학습자가 싫어하는 결과를 제공 (숙제 안해오면 화장실 청소)
- 부적 처벌 : 학습자가 좋아하는 것을 못하게 함. (숙제 안하면 TV 못본다.)
- 정적강화 = 부적처벌 / 부적강화 = 정적처벌? (어떤 행동을 증가시키는 방향? 감소시키는 방향? 에 따라서 강화와 처벌이 나뉨.)
- 처벌 : 오래 가지 못함. (신속하게 작동하긴 함. but 물리적 폭력 포함된 경우가 많아 이 또한 학습될 수 있음) / 강화는 빠르게 작동하지는 않으나 효과적.
- 일차 및 이차 강화와 처벌
- 일차 강화물 : 생물적 필요를 충족시키는 데 도움이 되는 것들
- 이차 강화물 : 고전적 조건 형성을 통해 일차 강화물과의 연합으로부터 효과성을 획득한 것 (대표적 이차 강화물은 돈)
- 즉각 대 지연 강화와 처벌
- 강화물의 효과성에 대한 핵심 결정인자는 행동과 강화물 발생간 시간 간격
- 쥐가 레버를 누른 후 먹이를 주는 강화에서, 그 간격을 1분 정도로 늘리면 효과가 없음.
- 금연과 다이어트가 쉽지 않은 이유?
- 처벌 또한 행동과 처벌 간의 간격이 멀 수록 처벌의 효과도 떨어지게 됨. (아이를 기를 때.)
- 지연된 처벌의 효과성을 증가시키기 위해 처벌의 엄격함을 증가시키거나 언어 지시를 사용할 수 있음. 그러나 즉각적 처벌보다 떨어지긴함.
- 변별, 일반화 및 맥락의 중요성
- 학습은 특정 맥락 하에서만 발달
- 모든 행동은 자극 통제(stimulus control) 하에서 일어나는데, 적절한 변별 자극(어떤 반응이 강화될 것임을 가리키는 자극)이 있을 때에만 특정 반응이 발달하게 됨.
- 동성 친구들과 있을 때만 야한 농담, 다른 자리에서는 그러하지 않음.
- 집에서만 거칠고 폭력적인 모습, 밖에서는 그러지 않는 남성
- 피카소와 모네의 그림을 변별 자극으로 훈련 받은 비둘기 (CS로 CR이 유도되는 상황에서 인상파 화가와 피카소를 구분함)
- 강화 계획 : 강화 간 시간 간격에 기초를 둔 계획과, 강화에 대한 반응 비율에 기초를 둔 계획
- 고정 간격 계획 : 적절한 반응이 만들어진다면, 고정된 시간 간격으로 제공(2분에 1번씩, 중간고사, 기말고사를 보는 학생? - 강화물이 주어질 때 쯤 열심히 반응.)
- 변동 간격 계획 : 그 직전의 강화 시간 이후 경과한 평균 시간에 기초해서 강화 (평균 2분마다, 라디오에서 특정 시간 동안 경품을 주는 경우)
- 고정 비율 계획 : 특정한 수의 반응이 만들어진 다음에 제공 (5번 누르면 강화 제공 - 치킨 쿠폰)
- 변동 비율 계획 : 강화의 제공은 반응들의 특정한 평균 수에 근거를 둠 (평균 5번 마다) - 카지노의 슬롯머신은 변동비율 계획을 따름.
- 고정이나 변동 간격 계획은 비교적 느리고 질서정연한 반응을 생성하는 경향 (고정/변동 비율 계획에 더 빠르게.)
- 변동 비율 계획이 고정 비율 계획보다 더 높은 반응 비율 보임.
- 20회 변동비율 계획이 5회 변동비율 계획보다 더 많은 반응을 나타나게 함. (간헐적 강화)
- 가장 소거가 일어나지 않게 하는 것이 간헐적 강화.
- 소거
- 조작 행동은 강화가 멈출 때 소거를 겪음.
- 반응 비율은 빨리 떨어지며, 휴지기가 주어지면 자발적 화복이 나타남.
- 강화 계획에 따라 소거 비율이 달라지며, 가장 소거가 어려운 경우는 간헐적 강화.
- 도박을 멈추기 어려운 이유?
- 중독 : 물질에 대한 내성, 금단 증상(그 물질이 없으면 고통이 생김. 부적강화와 비슷)이 생겨야 함.
- 행위에 대한 반복이 중독인가? 행위 장애는 잘 없음. 도박만이 행위 장애에 속함.
- 계기적 근사법을 통한 조성(복잡한 행동에 대한 설명)
- 조성(shaping) : 계기적 근사법에 의한 강화를 통해 최종 희망하는 행동을 학습하는 과정.
- 돌고래 쇼에서 돌고래는 어떤 행동을 할까? / 고양이에게 벨을 울리게 하는 것을 학습하는 과정.
- 최종 산물에 점점 더 가까이 다가가는 행동을 할 때마다 강화를 함으로써 결국에는 복잡한 행동을 할 수 있게 됨.
- 미신 행동
- 어떠한 인과성 없이 강화가 주어진다면?
- 비둘기의 반응과는 상관 없이 매 15초마다 음식이 나온다면? 비둘기는 이상하고 특이한 행동들을 열심히 하고 있음.
- 강화가 반응에 대해 유관하지 않을 때, 사람도 미신행동 같은 모습을 보임.
- 왜 운동선수들은 징크스가 있을까? (루틴 : 징크스라고 보기는 어려움. ex) 장갑을 다시 끼기, 헬멧을 다시 고쳐 씀)
- 본인의 노력이 바로 결과로 나온다고 확신하기 어려움 (강한 인과성이 없음) -> 이럴 때 징크스가 생기기 쉬운 상황.
- 조작적 조건형성의 인지적 요소
- 유기체의 정신과정에 대한 깊이있는 설명을 제시하지 않음.
- 톨먼(Tolman)은 동물이 수단-목적 관계성을 수립한다고 제안. : 조건 형성 경험은 어떤 특성 상황에서 특정 반응(수단)이 수행되면 특정 보상(목적)이 나올 것이라는 앎, 믿음을 낳는다.
- 잠재학습 : 무엇인가 학습되었으나 미래의 어느 시점까지 행동적 변화로 표출되지 않는 것. 행동주의자들이 학습에는 강화가 필요하다는 주장의 반증
- 2주간 미로에 투입된 세 집단의 쥐. (강화 X, 강화 O, 10일까지 강화 하지 않다, 그 이후 강화 O)
- 강화되지 않은 쥐 : 단순 반복이 이루어지긴 하나 학습이 크게 이루어지진 않음.
- 10일 이후 강화된 쥐 : 급속히 Error가 줄어들게 됨. 앞 10일동안 학습이 이루어짐. (잠재학습)
- 인지도 : 쥐들이 학습한 것이 인지도이다.(Cognitive map) : 환경의 물리적 특징들에 대한 정신적 표상
조작적 조건형성의 인지적 요소
- 왼쪽 통로로 학습한 쥐가 오른쪽 통로에 도달하였을 때 행동주의자들의 생각에 따르면 9번이나 10번 길로 갔어야 할텐데, 학습 과정에서 인지도가 생겨 주변 환경에 대해 인식하였으므로 먹이 방향인 5번으로 가게 됨.
- 신뢰 게임을 하는 인간 : 중립적 파트너와 게임할 때는 정적 및 부적 피드백을 구별하는 뇌의 영역이 명백히 활성화 됨. / 파트너에 대한 자세한 묘사(인지적 요소) (신뢰할 만한, 중립, 의심스러운)을 들은 경우 실제 공유행동에 차이가 없음에도 신뢰할만하다고 들은 파트너에게 더 많은 돈을 전달함으로써 손해를 보는 양상. 그 중 중립적이라고 말한 사람에 대해서만 원래대로 정적/부적 피드백을 구별하는 뇌의 영역이 활성화됨.
- 조작적 조건 형성의 신경적 요소
- 강화물의 배후 뇌 구조 : Olds가 발견한 쾌락 중추
- 시상 하부, 내측 전뇌속, 측핵이 회로를 이루고 있음.
- 강화와 가장 관련 있는 신경전달물질은 도파민 (쾌락과 관련되어 있는 것 / 보상이 올 것이라는 기대와 관련)
- 도파민은 보상의 그 자체보다 보상에 대한 기대와 더 밀접히 연결되어 있다는 것이 정설.
- 조작적 조건 형성의 진화적 요소
- T자형 미로에서 B부분에 먹이가 있는 것을 발견한 쥐.
- 시행에서 B로 계속 향하는 것이 아니라 A로 향함.
- 먹이를 얻을 확률을 높이는 쪽 (B에는 먹이가 이미 없으므로)
- 동전을 상자 안에 떨어뜨리는 단순한 동작 : 다른 행동은 잘 학습하는 돼지와 너구리가 거의 학습 못함
- 동물은 각 종의 진화 내력과 일치하는 방식으로 자극에 반응함.
This post is licensed under CC BY 4.0 by the author.