인공지능 특허를 받으려면 어떻게 해야 할까?
올해 상반기에 특허청은 인공지능 분야 심사실무가이드를 발표하면서 인공지능 특허를 받기 위한 요건에 대해서 제시하였다. 앞서 2019년도 하반기에 특허청은 인공지능(AI), 빅데이터를 비롯한 4차산업혁명 기술 분야 심사를 목적으로 융복합기술심사국을 설립하고 인공지능빅데이터심사과를 신설한 바 있다. 금번 인공지능 분야 심사실무가이드도 인공지능빅데이터심사과의 주도 하에 제정되었다. 특허청은 심사실무가이드의 추진 경과를 설명하면서, ETRI, 삼성, 네이버 등이 포함된 산업계와의 협의를 거쳤음을 밝혔다.
명칭으로 인한 오해가 있을 수 있는데, 인공지능 분야 심사실무가이드는 기계학습(Machine Learning) 기반의 인공지능 기술에 한하여 적용된다. 또한, 명세서 기재요건, 청구범위 기재요건, 성립성 요건, 신규성 및 진보성 요건 등 특허출원에 관한 제반 요건이 있지만, 필자는 이번 지면을 빌어서 진보성 요건만을 설명할 것이다. 예컨대 특허를 받을 수 있는 기술이란 진보성이 있는 기술을 말하기 때문이다. 한편, 특허 심사는 네거티브 방식이기에 특허를 받을 수 있는 경우보다는 특허를 받을 수 없는 경우를 보다 상세하게 설명하고 있음을 양해 바란다.
‘이런 정도로는 인공지능 특허를 받을 수 없다’
1. 인공지능 기술(이라는 워딩만)을 단순히 부가한 경우
“인공지능 기술을 이용하여” 또는 “인공지능 알고리즘에 따라” 정도로만 기재하고 있고, 구체적인 기술적 구성은 특정하지 않은 경우를 말한다. 표면적으로는 인공지능 기술을 이용한 것처럼 쓰여 있지만 실상은 룰베이스(Rule-based) 시스템인 경우가 많다.
앞서 밝힌 것처럼, 인공지능 분야 심사실무가이드는 기계학습에 관한 것이다. 기계학습이 되려면 룰을 기계(컴퓨터)가 스스로 찾아내야 한다. 전통적인 프로그래밍처럼 사람이 명시적으로 규칙이나 기준을 입력하는 방식으로는 인공지능 특허를 받을 수 없다.
2. 인공지능을 인간지능(Human Intelligence)처럼 사용하는 경우
특허청은 이 경우를 “사람이 수행하고 있는 업무 또는 비즈니스 방법을 공지된 인공지능 기술로 단순히 시스템화한 경우”라고 정의하였다.
인공지능 기술이라면, 동일한 데이터를 사용하더라도 기계의 이해를 위하여 피처(feature)를 추출하는 과정이 있다거나 전혀 다른 새로운 데이터를 학습 데이터로 하는 등의 차이점이 있어야 한다. 심사실무가이드는 “(사람이 수행하듯이) 과거 금융 거래내역을 입력데이터로 하여 대출 신청자에 대한 신용도를 평가하는 인공지능 기반 신용 평가 시스템”에 대해서 진보성을 긍정할 수 없다고 하였다.
3. 선행기술과의 차이점이 공지된 학습 모델에만 있을 경우
특허청은 이 같은 경우를 “인공지능 기술의 구체적 적용에 따른 단순한 설계변경”에 해당하는 것으로 보고 있다. 대표적인 사례로 ‘학습 데이터와 출력 데이터가 동일하고, 다만 학습 모델로 순환 신경망(RNN)을 합성곱 신경망(CNN)으로 대체한 경우’는 단순 설계변경 사항에 해당하여 진보성을 긍정할 수 없다고 하였다.
필자의 생각에 해당 내용은 산업계로부터 많은 이의 제기를 받았을 것이다. 주어진 데이터, 즉 학습 데이터가 제한적인 상황에서 학습 모델의 변경이나 조정을 통해서 성능 개선을 꾀하는 시도들도 많기 때문이다.
물론, 특허청도 학습 모델의 변경에 따라 더 나은 효과가 있고, 그러한 효과가 일반 기술자의 예측 가능 범위를 벗어나는 현저한 때에는 진보성을 긍정할 수 있다고 밝히고 있다. 이를 위해서는 변경된 학습 모델의 구체적인 구성을 특정하는 동시에 성능 향상을 입증하는 실험 데이터를 첨부할 필요가 있다.
4. 인공지능 기술의 단순 조합과 적용 또는 그 효과가 적은 경우
완전히 새로운 발명이란 없기 때문에, 대부분의 발명은 소위 말하는 ‘결합발명’이다. 이와 관련하여, 특허청은 소정의 목적을 달성하기 위해 어떤 분야에서 이미 이용되고 있는 방법, 수단 등을 조합하거나 특정 분야에 적용하는 것은 인공지능 기술 분야에서 광범위하게 시도되고 있으므로, 그 같은 기술의 조합이나 적용에 대해서는 특단의 사정이 없는 한 진보성을 부정하겠다고 밝히고 있다.
또한, 특허청은 ‘신속하게 처리할 수 있다’, ‘대량의 데이터를 처리할 수 있다’, ‘오류를 줄일 수 있다’, ‘정확한 예측을 할 수 있다’ 정도의 효과는 인공지능을 활용함에 따른 당연한 효과인 경우가 많고, 일반 기술자가 쉽게 예측할 수 있는 효과에 불과하다는 전제에서 진보성을 판단하겠다는 의견이다.
‘어떻게 하면 인공지능 특허를 받을 수 있을까?’
1. 데이터 전처리 방법에 기술적 특징이 있는 경우
입력 데이터로부터 피처(feature)을 도출하는 구성, 특정 규격화(벡터화, 정규화, 표준화)된 학습 데이터를 생성하는 구성 등이 구체적으로 기재되어 있으면 특허를 받을 수 있다. 단순히 “데이터 전처리를 수행한다”라고만 기재되어 있는 경우는 곤란하다.
2. 학습 데이터에 기술적 특징이 있는 경우
학습 데이터에 따라 학습 모델의 성능 및 그 결과가 크게 달라질 수 있다. 그러나, 심사실무가이드는 (학습 모델과 출력 데이터가 동일하다는 전제에서) 선행기술 대비 학습 데이터의 차이만으로 진보성을 인정하는 것은 곤란하다고 하고 있다.
필자가 보건대 본 내용도 산업계의 많은 반대가 있었을 것이다. 특허청은 발견(discovery)은 보호하지 않고, 발명(invention)만을 보호한다는 대원칙에 따라 부정적인 입장을 보인 것이다.
그러나, 의약(medicine) 발명과 같이 본질적으로는 발견에 해당하지만 학습 데이터의 선정에도 많은 노력과 비용이 소요되는 점을 고려했을 때, 약리 기전과 시험예를 기재하듯이 학습 데이터의 차이에 따른 특유의 효과와 구체적인 실시예를 기재한다면, 원칙적으로 진보성을 긍정하는 것이 바람직하지 않을까 생각해 본다.
유의할 것은, 학습 데이터가 아닌 피처(feature)에 기술적 특징이 있는 경우라면 앞선 데이터 전처리 방법에 기술적 특징이 있는 경우에 해당하여 특허를 받을 수 있다.
3. 학습 모델에 기술적 특징이 있는 경우
학습 환경 구성, 학습 모델 구현과 검증, 복수의 학습 모델들의 연계, 분산 또는 병렬 처리, 하이퍼 파라미터(hyper parameter) 최적화를 구현하는 구성 등이 구체적으로 기재되어 있으면 특허를 받을 수 있다.
오픈소스 프레임워크를 활용한 개발이 확산되고 있는 실정에서 새로운 학습 모델에 대해서 특허를 받는 경우는 흔치 않을 것 같다. 공지된 학습 모델을 다른 목적으로 사용하면서 일부 구성을 조정하는 상황이 대부분일 것이다. 예를 들어, 아키텍처(architecture)를 조정하여 튜닝한 부분이 있다면 그 내용을 충실히 담아내어 특허를 받을 수 있다.
4. 출력 데이터(학습 결과물) 활용에 기술적 특징이 있는 경우
응용(application) 측면에서 기술적 특징이 있는 경우를 말한다. 단계적으로 구분하면, 앞선 학습 단계(training phase)가 완료된 후의 추론 단계(prediction phase)가 이에 해당한다. 학습이 완료된 모델로부터 출력된 데이터를 활용하는 구성, 출력 데이터에 기반한 생산물(products), 출력 데이터에 기반한 처리 방법(process) 등이 구체적으로 기재되면 특허를 받을 수 있다.
5. 데이터 수집/저장 방법에 기술적 특징이 있는 경우
심사실무가이드에서는 다루어지지 않은 부분이다. 다음은 2018년도에 필자가 기계학습 프로세스 내에서 특허를 받을 수 있는 파트를 정리했던 내용이다. 대체적으로 동일한 관점인데, 심사실무가이드에는 원천(source) 데이터의 수집 방법, 사후관리 목적의 데이터 저장 방법 등이 빠져 있어 이를 보충하고자 한다.
MLOps가 온전하게 도입되려면 원천 데이터의 수집, 학습 데이터의 구축, 학습과 검증의 일련의 과정이 실시간으로 또는 주기적으로 반복(iteration) 되어야 한다. 따라서, 이 같은 기술적 과제를 갖고 원천 데이터의 수집 방법에 기술적 특징이 있는 경우라면 특허를 받을 수 있다. 또한, 학습 단계 및 추론 단계에서 지속 발생하는 데이터의 저장 관리도 특허로 고려될 수 있는 파트이다.
저자소개 : 김성현 파트너 변리사는 한양대 정보통신학부와 고려대 기술경영전문대학원을 졸업했습니다. 기술가치평가사, 기술거래사 및 VC전문인력 자격을 함께 보유하고 있으며, 기술사업화, 투자 및 IPO에 관심이 많습니다. ICT 전공을 기반으로 인공지능, IoT, 클라우드 컴퓨팅, 블록체인 등과 지능형 반도체, 체외진단기기와 같은 융복합 기술을 주로 담당하고 있습니다.