그렇다. 또 인공지능이다. 최근 우리는 논문을 읽을 때는 물론, TV를 틀거나 심지어 마트에서 과일을 살 때도 인공지능이라는 단어를 접한다. 말 그대로 인공지능이 우리의 생활에 이미 범람하였다. 이건 해외도 마찬가지다. 'Big wave of artificial intelligence'라는 표현이 모든 분야에서 등장하고 있다. 그리고 여러분이 지금 읽는 이 칼럼 또한 인공지능을 얘기할 것이다.
충격적이었던 ChatGPT의 등장 이후 많이 기울기는 했지만, 여전히 인공지능의 활용성에 대해서는 찬반이 존재한다. 사실 결정론적인 사고에 대한 교육을 주로 받아온 우리들에게 인공지능 기술은 때로 블랙박스로 느껴져, 그 정확도에 상관없이 쉽게 받아드리기 어렵다(심지어 아인슈타인도 양자역학에서 비슷한 감정을 느꼈다!).
필자 역시 사실 매우 단순한 기저 함수(basis function)로 구성된 신경망(neural network)의 원리가 대중들에게 과대 포장된 것에 대해서는 우려도 된다. 좀 더 과감하게 말하자면 '기계학습은 우아한 커브피팅(curve fiting)'이라는 말에 일부 동의한다.
필자는 '인공지능은 인공지능 답게 사용하라'라는 말을 학생들에게 자주한다. 차원이 작은 문제에서 적은 데이터 사이에 내삽(interpolation)이 필요한 경우, 신경망이 아닌 단순한 선형회귀(linear regression)면 충분하다. 이런 문제에 딥러닝을 적용하면 소위 '닭 잡는 데 소 잡는 칼을 쓰는 것'이다. 학습 시간도 오래 걸릴 뿐 더러 차원의 저주로 정확도 마저 감소할 수 있다. 그럼 인공지능을 어떻게 인공지능 답게 사용할 수 있을까?
첫 번째, 인공지능은 인간이 결정론적으로 모델링하기 어려운 높은 차원의 문제에서 그 성능이 위력적이다. 데이터가 충분할 경우, 외삽(extrapolation)을 포함하여 기존 커브피팅으로 불가능한 문제들을 해결할 수 있다.
이 경우, 신경망은 우리가 기대하는 'Universal Nonlinear Function Approximator'로서 활용될 수 있다. 두 번째, 데이터에 대해 우리가 가진 도메인 지식을 신경망 디자인에 반영할 수 있다면 성능을 크게 향상시킬 수 있다. 가장 대표적인 예시가 이미지의 두 가지 특성 (1) stationarity of statistic (2) locality of pixel dependences를 반영한 CNNS(convolutional neural networks)의 성공이다. [1].
반대로 말하면 적은 데이터양으로 현재 데이터의 특징을 반영하지 않은 인공지능 모델을 사용한다면, 사실 인공지능이 아닌 커브피팅을 하고 있을 지도 모른다는 것이다 (필자도 인공지능을 처음 배울 때 그런 시행착오를 거쳤다).
대표적인 고차원 데이터 유형은 이미지와 자연어이다. 최소 2차원의 픽셀 단위로 이뤄진 이미지는 FCN(fully connected layer)으로 다루기 어려울 정도의 고차원이며 (그래서 CNNs이 개발되었다), 수많은 자연어를 임베딩하기 위해서는 고차원의 단위 벡터가 필요하다. 전통적으로 컴퓨터 공학 분야에서 인공지능 기술이 가장 활발히 연구되어온 연구 데이터 대상이 이미지와 자연어인 이유이기도 하다.
공학분야에서도 물론 이러한 고차원 문제가 존재한다. 그 대표적인 분야가 전산유체역학(CFD ; computational fluid dynamic)이다. CFD는 유체의 질량, 운동량, 그리고 에너지 변화를 공간, 시간에 따라 시뮬레이션하는 분야로써, 비정상(transient) CFD 데이터는 한 시계열이 이미지의 속성을 갖으면서 동시에 자연어의 연속된 시계열 속성을 갖는다. 또한 CFD의 지배방정식(governing equation)인 나비에-스토크 방정식은 식 자체도 비선형적이기 때문에 예측을 위해서는 선형회귀가 아닌 신경망 수준의 머신러닝 모델을 요구한다.
CFD에서 인공지능 활용이 유리한 부분이 있다. 바로 지배방정식을 포함하여 데이터에 대한 도메인 지식이 상대적으로 풍부하다는 것이다. 공학분야에서의 도메인 지식은 물리지식(physics-informed)로 불린다. 그 대표적인 예시가 우리는 손실함수에 지배방정식을 직접 대입할 수 있다는 것이다.
3편에서 주로 소개할 PINNs(Physics-informed neural networks)의 경우, 이론적으로는 지배방정식만으로 손실함수를 구성하여 비지도학습형태로도 학습이 가능하다. 일반적인 data-driven 인공지능은 식(1)의 PDE를 계산하기 위하여
😥 미리 보기는 여기까지!
내용을 이어서 보고 싶다면,
아래 정보를 입력해 주세요.