Deep Learning Through Various Processes

4차 산업혁명에 있어서 무엇보다 선행되어야 할 것은 바로 산업군별 프로세스에 대한 realignment와 improvement이다.
그리고 이에 따른 Data Process alignment이다.
그래야만 딥러닝에서 가장 중요한 파라미터의 수를 획기적으로 줄여 추정할 수 있고
모수의 Scope을 줄인다는 것은 바로 Infra Cost절감과 Model Size의 Minimize와 관련이 있다.
위의 모든 것들을 고려한 것이 바로 딥러닝을 적용할 수 있는 추상화 아키텍처의 근간이 된다.

딥러닝 알고리즘을 솔루션화하고 서비스화 하는 것은 바로 업의 특성에 맞는 프로세스를 제대로 알고 이에 맞추어 프로세스를 개선할 수 있는 메카니즘을 적립하고 기존에 사용되고 있는 방법보다 개선된 점이 있는지에 대한 검증 방안을 갖추어 놓은 상태에서 AI MODEL SERVING LAYER단에서 MODEL REPLACEMENT에 대한 방안 그리고 정확도나 실 데이터 유입 시 장애 대응에 대한 고려 모델 교체 주기 및 모델 라이프 사이클 정립이 무엇보다 중요하다고 생각한다.

하지만 아무도 그런 것들에 대해서는 깊게 이야기 하지 않는다.

그 이유는 아직도 제대로 실생활이나 산업현장에서 제대로 돌아가는 검증된 모델과 프로세스가 정립되지 않았기 때문이다.
이에 그간의 경험을 바탕으로 다양한 산업군에서 어떻게 딥러닝 알고리즘이 솔루션화되고 서비스화 되는 것이 맞는 것인지에 대해 정리해 본 자료를 공유해 본다.


철강업의 경우 일관밀 공정으로 마지막 단에서 철강 제품의 다양화와 출하를 하기 위해 Task가 나눠진다.
이에 따라 중간 공정까지 이어지는 데이터를 마지막 Task까지 맵핑하는 Data Serialization과 Task Parallelism이 데이터 프로세스에서 가장 중요한 부분이며, 이 부분에서 모아지는 Feature set들을 바탕으로 Data Transform이 이뤄져 그 후 딥러닝 모델이 생성될 수 있는 기반 환경을 조성해야 하는 것이 무엇보다 중요하다.
가장 큰 한계는 Legacy Data에 대한 그리고 노후화된 장비에서 나온 Data Set에 대한 신뢰성 확보에 있다.
신기술 적용을 위한 다양한 프로세스 고도화가 선행되고 해당 Data와 Binding되어야만 Parameter를 축소하고 이를 통한 딥러닝 알고리즘을 적용할 수 있는 선순환적 토대가 마련된다


반도체 공정도 위와 유사하지만 가장 큰 차이점은 CNN기반의 생성 모델이 필수적으로 들어가야 하며, 마지막 출하 공정의 불량률을 잡는 것 보다 웨이퍼 공정의 불량률 검출이 비용 절감 측면에서 가장 중요한 부분이라는 점이다.
공정단 끝에서 여러가지 기법을 통해 딥러닝을 적용하는 것이 연구되고 있으며 현재는 포토공정 내에 딥러닝 적용에 대한 연구가 활발하게 진행 중이다.


의료 같은 경우는 의료법과 개인정보보호법상의 문제로 Federated Learning이 쓰일 수 밖에 없는 상황이다.


금융 같은 경우 다양한 시장 예측에 토대가 되는 고객의 위험 감내도와 시장의 위험도를 매트릭스 차원으로 구성한 Risk Profile이 필수적으로 구성되어야 한다.


챗봇 같은 경우는 무엇보다 Intent Scope이 중요한데 이를 한방에 정리해 버린 Transfer Learning기법이 출현하였다.
하지만 챗봇 경우에는 여러가지 기술들을 혼용해 써야만 사용자 질의에 맞는 다양한 접근법들을 구사할 수 있어야 한다.
반드시 딥러닝 모델이 우수하다는 확증 편향적인 생각은 배재해야 하고 고객에게 제안할 컨텐츠와 내용 그리고 기존에 상담센터 데이터를 분석할 때 어떻게 접근하고 향후 운영에 대한 방안까지 고려한 아키텍처 설계가 우선시 되어야만 한다
그리고 기술을 접목할 수 있는 다양한 Adaptation Layer에 대한 깊이 있는 설계가 무엇보다 선행되어야 한다.

Tagged , , , ,

Leave a Reply

Your email address will not be published. Required fields are marked *