Current Issue

Journal of Hydrogen and New Energy - Vol. 36, No. 6

[ Article ]
Transactions of the Korean Hydrogen and New Energy Society - Vol. 36, No. 6, pp. 714-723
Abbreviation: KHNES
ISSN: 1738-7264 (Print) 2288-7407 (Online)
Print publication date 30 Dec 2025
Received 27 Oct 2025 Revised 17 Nov 2025 Accepted 24 Nov 2025
DOI: https://doi.org/10.7316/JHNE.2025.36.6.714

HAZOP 예측을 위한 LLM과 다중출력 로지스틱 회귀 모델의 통합 접근법
이동근1 ; 쿠엔1 ; 응웬앵덕1, 2 ; 박진영1 ; 배용균1, 3 ; 김영상1, 2,
1한국기계연구원 무탄소발전연구실
2과학기술연합대학원대학교
3중앙대학교

Integrating LLM and Multioutput Logistic Regression for HAZOP Prediction
DONGKEUN LEE1 ; THAI-QUYEN QUACH1 ; ANH DUC NGUYEN1, 2 ; JINYOUNG PARK1 ; YONGGYUN BAE1, 3 ; YOUNGSANG KIM1, 2,
1Korea Institute of Machinery & Materials (KIMM), 156, Gajeongbuk-ro, Yuseong-gu, Daejeon, Korea
2University of Science and Technology (UST), 156, Gajeongbuk-ro, Yuseong-gu, Daejeon, Korea
3Department of Chemical Engineering, Chung-Ang University, Seoul 06974, Korea
Correspondence to : yskim@kimm.re.kr


2025 The Korean Hydrogen and New Energy Society. All rights reserved.
Funding Information ▼

Abstract

The Hazard and Operability Study (HAZOP) is a widely used method for ensuring process safety, but it still relies on expert judgment. As a result, the analysis is time consuming and often lacks consistency. In this study, methodology for prediction of frequency and severity of HAZOP was proposed using Large Language Models (LLMs) and multioutput logistic regression model. The results demonstrated that the LLM-based preprocessing approach achieved the highest prediction accuracy, while the direct LLM prediction showed strong contextual reasoning but lower accuracy. These findings suggest that the hybrid of LLM and machine learning currently offers the most practical balance between interpretability and accuracy. Furthermore, with the advancement of large-scale and multimodal AI models, automated and standardized HAZOP analysis is expected to become increasingly feasible in the near future.


Keywords: HAZOP, Solid Oxide Electrolysis Cell, LLM, Logistic Regression, Safety Assessment
키워드: 위험과 운전 분석, 고체산화물 수전해 전지, 대형 언어 모델, 로지스틱 회귀, 안전성 평가

1. 서 론

산업혁명 이후 화석연료의 사용 급증으로 인해 지구 온난화와 기후변화가 인류의 주요한 위협으로 대두되고 있으며, 이에 따라 탄소 배출을 저감하기 위한 탄소중립 정책이 전 세계적으로 추진되고 있다. 이러한 흐름 속에서 화석연료를 대체할 수 있는 청정에너지로서 수소가 주목받고 있다. 수소는 연소 시 이산화탄소를 배출하지 않고, 에너지 저장 및 운송이 용이하다는 장점을 가지고 있어 차세대 탄소중립 에너지의 핵심 축으로 자리 잡고 있다.

특히 고체산화물 수전해 전지(Solid Oxide Electrolysis Cell, SOEC) 기술은 기존의 저온 수전해 기술(PEM, 알칼라인)에 비해 전기적 에너지 요구량이 낮고, 고온의 열에너지를 전기화학 반응에 활용함으로써 높은 전환 효율을 달성할 수 있다는 점에서 주목받고 있다.

SOEC 시스템은 고온 환경에서 폭발성 수소를 다루기 때문에 안전한 설계와 제어가 필수적이다. 고온 수전해는 셀 내부의 환원·산화 환경이 복합적으로 얽혀 있어 운전 조건의 작은 변화도 안정성에 큰 영향을 미칠 수 있다. 또한 공기 블로워, 스팀 공급장치, 수소 재순환 블로워 등 다양한 주변부품(Balance of Plant, BOP) 구성요소가 결합되므로, 설계 단계부터 잠재적 위험요인을 체계적으로 식별·분석해야 한다. 이를 위해 HAZOP (Hazard and Operability) 기법이 활용되며, 공정 이상 상태를 구조적으로 검토해 위험 요소와 원인·결과를 도출하는 대표적 안전성 평가 방법으로 사용되고 있다.

고온 수전해 시스템은 작은 운전 편차도 심각한 안전 문제로 이어질 수 있다. 그럼에도 HAZOP은 전문가의 경험과 판단에 크게 의존하며, 편차(Deviation), 원인(Cause), 결과(Consequence)를 모두 검토해야 하는 노동집약적 절차로 인해 누락과 편차가 발생하기 쉽다. 특히 빈도(Frequency)와 강도(Severity) 평가에서도 전문가 간 차이가 생겨 일관성 확보가 어렵다. 이러한 문제는 시스템 규모와 복잡성이 증가할수록 더욱 두드러지며, 이에 따라 HAZOP의 자동화·지능화 필요성이 커지고 있다.

국내에서도 연료전지 및 수전해 시스템을 대상으로 한 HAZOP 기반 안전성 연구가 활발히 진행되고 있다.

우선, 연료전지 및 수전해 시스템의 운전·설치 과정에서 발생할 수 있는 잠재적 위험요소를 체계적으로 검토하기 위해, HAZOP 기법을 기반으로 한 정성적 위험성 평가가 수행되고 있다. 그러나 기존의 HAZOP은 평가자의 경험과 전문성에 의존하는 경향이 강해, 동일한 시스템이라도 평가 결과가 상이할 수 있다는 한계가 지적되었다. 이를 보완하기 위해 위험요소를 체계적으로 분류하고, 평가자가 참고할 수 있는 위험요소 라이브러리를 구축하여 누락 및 편차를 최소화하는 연구가 수행되었다1).

기존에는 수소 생산 장치 또는 연료전지 단독 설비에 대한 위험성 평가는 수행되었으나, 이들을 통합한 복합 시스템에 대한 HAZOP 기반 분석은 미비하였다. 따라서 통합 운전 시 발생 가능한 공정 간 위험전이 및 연계 구조상의 문제를 파악하고, 이를 개선하기 위한 안전대책을 마련하는 연구가 수행되었다2).

또한, 국내 수소도시 시범사업과 같은 실증적 환경에서는 수소 추출장치와 연료전지를 통합 운전하는 시스템의 실질적 위험요소를 평가하기 위한 노력이 이루어지고 있다. 해당 연구에서는 공정 위험을 평가하는 HAZOP과 더불어 인적 오류를 분석하는 JSA (Job Safety Analysis)를 병행 수행함으로써, 설비적·운영적 측면에서의 복합 위험요인을 종합적으로 검토하였다. 이를 통해 도출된 결과를 바탕으로 통합 시스템의 안전 매뉴얼 및 운영 지침을 마련하여, 실제 현장에서 적용 가능한 안전관리체계 확립을 목표로 하였다3).

연료전지와 수소를 벗어난 다양한 수소 활용 분야에서도 HAZOP 연구들이 수행되고 있다. 수소 혼소 발전 분야에서도 위험성 평가는 중요한 설계 요소로 인식되고 있다. 천연가스와 수소를 혼소하는 복합화력발전소의 설계 단계에서 HAZOP을 수행하여, 배관 구성, 보조설비 위치, 제어 로직 등에서 발생할 수 있는 잠재 위험요소를 식별하였다. 이를 바탕으로 설비 배치 변경, 안전교육 강화 등 구체적 개선안을 제안함으로써 수소 혼소 발전소의 안정적 운전 기반을 마련하였다4).

수소 활용 분야에서는 HAZOP 결과가 현행 규정 적용의 근거 자료로 활용되고 있다. 대표적 그린수소 기술인 알칼라인 수전해는 상용화가 진행 중이지만 공정 내 다양한 위험요소가 존재한다. 특히 비상정지나 이상압력 발생 시 대응 체계가 명확하지 않으면 공정 안정성에 큰 영향을 줄 수 있다. 현행 KGS CODE AH271은 기본적 기준만 제시해 실제 운전 대응에 한계가 있어, 이를 보완하기 위해 해당 법규와 HAZOP을 기반으로 비상정지 시나리오 및 원인·대응방안을 체계화하는 연구도 수행되었다5-9).

수소 활용 확대에 따라 안전성 평가의 중요성이 커지고 있으며, HAZOP 기반 결과물도 향후 규제에 반영될 것으로 예상된다. HAZOP은 오랜 기간 화학 공정에서 활용되며 절차가 고도화되었지만, 수행자 역량·인적 실수·평가 시기 등의 영향을 받아 결과가 균일하거나 신뢰성 있게 나오지 않는 한계도 지적된다2).

이러한 한계를 보완하기 위해 인공지능 기반 HAZOP 자동화가 주목받고 있다. 특히 대형 언어모델(Large Language Model, LLM)은 비정형 텍스트로부터 문맥적 의미를 추론할 수 있어, 전문가 보고서나 공정 로그에서 위험 패턴을 자동 학습·예측하는 잠재력을 지닌다. LLM은 원인–결과 간 관계를 파악해 인간의 판단을 보조하거나 일부 대체할 수 있으며, 이를 통해 HAZOP 분석의 효율성과 일관성을 향상시킬 수 있다.

한편, LLM은 강력한 표현력과 추론 능력을 가지지만 모델의 복잡성과 높은 계산 비용, 결과 해석의 어려움이라는 한계를 가지고 있다. 이에 반해 전통적인 통계 기반 기법들도 활용을 기대할 수 있다. 그중 로지스틱 회귀(Logistic Regression)는 구조가 단순하고 결과 해석이 용이하다는 장점을 가지며, 입력 변수의 영향도를 명확히 확인할 수 있다. 따라서 LLM의 비정형 데이터 처리 능력과 로지스틱 회귀의 정량적 해석 가능성을 상호 보완적으로 결합하는 접근이 효과적일 것으로 기대된다.

네덜란드 델프트 공과대학교(Delft University of Technology)의 Process Intelligence 그룹은 다양한 AI를 화학 공정에 적용하는 연구를 진행하고 있다. 이미지 프로세싱을 활용해 공정 흐름도(Process Flow Diagram, PFD)와 공정배관계장도(Piping and Instrumentation Diagram, P&ID) 이미지로부터 구성품을 추출하고, 이들의 연결 구조를 데이터화하였다10). 또한 구축된 DB 활용을 위해 문자 기반 공정 표기법인 SFILES (Simplified Flowsheet Input-Line Entry-System)을 적용하였다11,12). 이러한 접근은 기존 통계 기반 방법을 넘어 LLM 기술의 적용 가능성을 보여주며, 이를 통해 PFD 자동 생성, PFD/P&ID 전환, 공정 개선, HAZOP 분석 등으로 확장될 수 있음을 제안하였다.

최신 LLM 기술은 문자로 표현된 편차·원인·결과 정보를 이해하고 추론할 수 있어 HAZOP 분석에도 적용될 수 있다. 과거에는 클라우드 기반 API가 주된 활용 방식이었으나, 최근에는 로컬 환경에서 구동 가능한 모델이 확산되면서 데이터 외부 전송 없이 보안성과 기술 자립성을 확보할 수 있게 되었다. 또한 경량화된 로컬 LLM은 적은 연산 자원으로도 충분한 성능을 제공해, 보안성·독립성·실용성을 강화하는 대안으로 주목받고 있다.

SOEC 시스템은 고온·수소 환경의 복합 위험요소를 지니지만, 기존 HAZOP 연구는 주로 알칼라인·PEM 수전해나 단일 연료전지에 집중되어 SOEC–BOP 통합 시스템을 다룬 사례가 매우 제한적이다. 또한 전통적 HAZOP은 전문가 경험 의존성과 노동집약적 절차로 인해 결과의 일관성 부족, 누락·편차 발생 등의 문제가 지속적으로 제기되고 있다. 그럼에도 HAZOP 텍스트에서 위험 패턴을 추출하고 자동화하려는 시도는 국내외 모두 부족하다. 최근 화학 공정 분야에서 AI 활용 연구가 진행되고 있으나, HAZOP 텍스트를 대상으로 한 LLM 기반 위험요인 및 등급 예측 연구는 거의 없는 상태이다. 따라서 수소 에너지 시스템의 HAZOP 데이터 분석과 텍스트 기반 위험 등급 예측 모델 개발은 여전히 해결되지 않은 주요 연구 과제로 남아 있다.

본 연구는 기존 HAZOP의 경험 의존성과 비일관성을 보완하고, SOEC 시스템의 위험성 분석을 자동화하기 위한 새로운 AI 기반 접근을 제시한다. 첫째, 본 연구는 SOEC 시스템을 대상으로 HAZOP 텍스트를 직접 활용한 AI 분석을 수행한 초기 연구 중 하나로, 기존 저온 수전해·연료전지 중심의 HAZOP 연구와 차별된다. 둘째, 로컬 Llama 기반 LLM을 활용하여 편차–원인–결과 간의 문맥적 관계를 자동 추출하고 위험 패턴을 구조화함으로써 HAZOP 절차의 자동화 가능성을 제시하였다. 셋째, LLM의 의미 해석 능력과 다중출력 로지스틱 회귀의 정량적 해석성을 결합하는 새로운 통합 모델을 구성하여 위험 등급(빈도·강도)을 동시에 예측하는 체계를 마련하였다. 넷째, 전문가가 수행한 실제 SOEC HAZOP 데이터를 활용해 모델을 학습·검증함으로써 자동화된 위험성 평가의 정확성과 일관성을 실증적으로 확인하였다. 마지막으로, 로컬 LLM 기반 환경을 적용하여 민감한 안전 데이터의 외부 유출을 방지하고, 산업 적용에 필요한 보안성과 독립성을 확보하였다.


2. 모델 개발 및 절차
2.1 데이터 구성

데이터는 SOEC 시스템의 HAZOP을 통하여 얻어졌으며, 총 156 set의 데이터가 확보되었다. 각 데이터는 이탈, 원인, 결과, 현재 안전조치로 구성되어 있고, 이에 따른 빈도와 강도가 1∼5의 수치로 표기된다. 이탈은 정상 운전 조건에서 특정 공정 변수가 벗어나는 현상을 의미한다. 예를 들어 스팀 유량이 정상보다 낮거나(No/Low Flow), 스택 내부 압력이 과도하게 높거나(High Pressure), 또는 셀 온도가 설정 범위를 초과하는(High Temperature) 등의 상태가 이에 해당한다. SOEC 시스템은 고온 및 수소 환경에서 운전되기 때문에, 이러한 미세한 이탈조차도 시스템 전체의 열적 평형이나 전기화학 반응 안정성에 큰 영향을 미칠 수 있다.

원인은 이러한 이탈을 유발하는 물리적·기계적·제어적 요인을 뜻한다. 스팀 공급 밸브의 폐쇄, 펌프나 블로워의 고장, 압력조절밸브 불량, 온도센서의 오류, 제어신호 손실 등은 대표적인 예다. 또한 운전자의 조작 실수나 시동·정지 절차 미준수와 같은 인적 요인도 주요 원인으로 작용할 수 있다.

결과는 이탈이 실제로 시스템에 미치는 영향으로, 열응력에 의한 스택 파손, 수소 누출에 따른 폭발 위험, 효율 저하, 전극 손상 등이 주요 결과로 나타난다. 특히 수소와 산소가 동시에 존재하는 SOEC 공정 특성상, 한쪽 유로의 누설이나 압력차 발생은 폭발성 혼합가스 형성으로 이어질 수 있어 위험성이 크다.

현재 안전조치는 이러한 위험을 예방하거나 완화하기 위해 시스템 내에 이미 설치된 보호장치 및 운전 절차를 의미한다. 예를 들어 온도·압력·유량을 감시하는 계측기와 인터락 제어, Relief Valve나 Rupture Disk 같은 기계적 보호장치, 과전류 차단장치, 비상정지 스위치, 시동·정지 표준운전절차 등이 대표적이다.

이러한 HAZOP 데이터들은 모두 문자열로 작성된 데이터로 일반적으로 공학에서 다루는 데이터의 형태인 숫자의 데이터 형태로부터 많이 벗어난다. 더욱이 문자열이 가지는 문맥적 관계, 이탈-원인-결과-현재 안전조치로 연결되는 인과관계적인 부분도 데이터로부터 도출되어야 하는 부분이다. 문자열 데이터를 숫자화(Vectorization)하는 방법에는 여러 방법이 있다. LLM 모델에서 활용하는 문맥적 의미를 반영하는 임베딩 기법, 문자열내 중요도를 계산하는 TF-IDF (Term Frequency – Inverse Document Frequency) 기법이 있다. 본 연구에서는 LLM을 활용함으로써 내재된 임베딩 기법이 사용되었으며, LLM 활용이 아닌 다중출력 로지스틱 회귀 모델 사용을 위해 TF-IDF 기법을 사용하였다.

2.2 LLM 모델

본 연구에서는 로컬환경에서 사용이 가능한 공개된 LLM 모델을 사용하였다. LLM은 방대한 양의 텍스트 데이터를 학습하여 언어의 패턴과 의미를 이해하고, 이를 바탕으로 텍스트 생성, 요약, 번역, 질의응답, 코드 생성 등 다양한 언어 기반 작업을 수행할 수 있는 인공지능 기술이다. 이러한 모델은 수십억에서 수조 개에 이르는 매개변수를 가지고 있으며, Transformer 구조를 기반으로 사전학습(Pre-training)과 지시튜닝(Instruction tuning)을 거쳐 인간의 언어 이해 및 추론 능력에 근접한 성능을 구현한다.

현재 LLM은 단순한 자연어 처리 기술을 넘어 산업 전반에 걸쳐 활용되고 있다. 응용 분야에서 이미 상용화 단계에 도달하고 있고, 멀티모달 입력(텍스트·이미지·음성 등)을 다루는 통합형 AI로 발전하는 추세이다. 이처럼 LLM은 언어 중심의 작업을 자동화하고 지식 기반 의사결정을 지원하는 핵심 기술로 자리 잡고 있다.

이 가운데 Meta에서 공개한 Llama 3.1 8B 모델은 2024년에 공개된 Meta의 최신 공개형 LLM으로, 약 80억 개의 매개변수를 가진 중형급 모델이다. 동일 계열에는 70B와 405B 버전이 존재하지만, 8B 모델은 경량화된 구조를 바탕으로 개인용 워크스테이션에서도 실행 가능한 모델이다. Llama 3.1 8B는 지시튜닝이 완료된 형태로 배포되어, 대화형 질의응답, 문서 생성, 기술요약 등 범용적 활용이 가능하다.

Llama 3.1 8B는 16 GB 수준의 VRAM에서도 추론을 수행할 수 있다. 연구자나 개발자가 민감한 데이터를 외부로 전송하지 않고도, 자체 하드웨어에서 모델을 실행할 수 있다. 물론, 최근 공개된 GPT-5는 매개변수 규모가 수조 개 이상일 것으로 추정되며, 고급 논리추론·멀티모달 처리·지능형 작업 분배 기능을 갖춘 초대형 모델로 알려져 있다. 규모 면에서 GPT-5는 Llama 3.1 8B보다 수백 배 이상 크며, 성능 또한 최고 수준이지만, 운영에는 막대한 연산 자원과 클라우드 인프라가 요구된다. 또한, 활용하고자 하는 기술에 따라 데이터 프라이버시와 보안 측면에서 사용자의 데이터가 외부 서버로 전송되지 않아 정보 유출 위험이 현저히 적은 로컬 구동 가능한 LLM은 필수적이다. 이는 국가 연구기관, 산업기밀, 의료정보 등 민감 데이터를 다루는 환경에서 특히 유리하다. 기술 자립성 및 통제권 확보의 관점에서도, 모델 버전·튜닝 방식·운영 로그 등을 스스로 관리할 수 있어 외부 API나 서비스 중단에 영향을 받지 않을 수 있으며, 비용 효율성 및 응답 지연 감소 측면에서, 로컬 구동은 네트워크 지연을 줄이고 API 호출 비용을 절감한다. 또한 필요 시 내부 데이터를 이용한 정밀튜닝을 통해 도메인 맞춤형 성능을 강화할 수 있다는 장점이 있다. 따라서, 본 연구에서는 GPT 5 수준의 초대형 모델을 활용하는 방법이 아닌 로컬에서 구동가능한 모델을 활용하였으며, 이는 연구자의 자유롭고, 안전한 접근이 가능한 방법으로 판단하였다.

2.3 다중출력 로지스틱 회귀 모델

다중출력 로지스틱 회귀모델은 여러 개의 종속 변수를 동시에 예측하기 위해 기존 로지스틱 회귀를 확장한 형태의 분류 모델이다. 기본적인 로지스틱 회귀는 하나의 입력 벡터에 대해 단일한 이진 또는 다중 클래스 결과를 예측하지만, 다중출력 로지스틱 회귀는 하나의 입력에 대해 서로 다른 여러 개의 이진 분류 결과를 동시에 산출한다는 점이 특징이다.

로지스틱 회귀는 시그모이드(Sigmoid) 함수를 기반으로 입력값을 0과 1 사이의 확률로 변환하는 대표적인 분류 모델이다. 시그모이드 함수는 아래의 식으로 표현된다.

σz=11+e-z(1) 

시그모이드 함수는 입력 z가 커질수록 출력값이 1에 가까워지고, 작아질수록 0에 수렴한다. 이러한 특성을 다출력 변수에 적용한 방법이 다중출력 로지스틱 회귀모델이다. 입력 특징에 대해 여러 개의 출력 변수를 동시에 예측할 수 있고, 각 출력 yi는 다음과 같은 독립적인 로지스틱 회귀식으로 계산된다.

Pyi=1X=σXwj+bj(2) 

즉, 각 출력 변수마다 고유한 가중치 wj와 절편 bj가 존재하며, 모델은 여러 개의 로지스틱 회귀를 병력적으로 학습한다.

이러한 다출력 로지스틱 회귀는 여러 목표 변수를 동시에 예측해야 하는 경우 유용하다. 예를 들어 SOEC HAZOP 데이터에서 입력(이탈-원인-결과-현재 안전조치)으로부터 빈도와 강도를 동시에 예측하는 상황을 들 수 있다. 각각의 출력이 서로 다른 로지스틱 회귀기에 대응되며, 두 결과를 병렬적으로 산출함으로써 모델은 하나의 입력으로 다중 위험지표를 동시에 평가할 수 있다.

2.4 통합 활용 방안

본 연구에서는 LLM과 다중출력 로지스틱 회귀모델을 사용하여 HAZOP을 예측하는 세 가지 방법을 사용하였다. Fig. 1은 LLM과 다중출력 로지스틱 회귀모델을 사용해 HAZOP을 예측하는 세 가지 방법을 나타낸다. 첫 번째 방법은 전통적인 머신러닝 기법을 활용한 방법으로 문자열로 된 이탈, 원인, 결과, 현재 안전조치의 내용을 TF-IDF 방법을 사용하여 벡터화를 진행한다. 벡터화된 이탈, 원인, 결과, 현재 안전조치의 입력값과 이에 따른 빈도와 강도의 출력값을 이용하여 다중출력 로지스틱 회귀모델을 학습한다. 본 연구에서는 대표적인 머신러닝 예측 모델중 하나로서 다중출력 로지스틱 회귀모델을 이용하였으나, 이러한 예측에는 충분히 다양한 머신러닝 예측 모델이 사용될 수 있다. 다중출력 로지스틱 회귀모델을 학습시키고 학습된 모델을 이용해 Test Data를 평가를 수행하였다.


Fig. 1. 
Estimate process of HAZAOP using LLM and Multi-output logistic regression models

두 번째 방법은 LLM 모델을 데이터 전처리 방안으로 활용하고, 이를 전통적인 머신러닝 기법으로 예측하는 방법이다. LLM 모델은 정제되지 않은 HAZOP의 문자열을 정돈하고 표준화된 표현으로 개선하는데 활용할 수 있다. HAZOP은 사람이 수행하는 업무이기 때문에 이탈, 원인, 결과, 현재 안전조치에 작성된 내용은 작성자의 화법에 따라, 사물을 지칭하는 방법에 따라, 설명하고자하는 의도에 따라서도 차이를 보일 수 있다. 따라서, HAZOP은 사용자의 이해가 가능한 수준으로 작성되기 떄문에 작성된 문자열 데이터는 표준화되지 않게 작성되어 있다. 가장 쉬운 예로는 ‘질소’, ‘N2’, ‘Nitrogen’, ‘고압질소’, ‘액체질소’, ‘LN2’의 표현이 복합적으로 사용되고 있다. 같은 대상에 여러 표현은 데이터 분석과 머신러닝에서 있어서 혼동과 부정확한 학습을 초래할 수 있다. 이러한 비표준화된 내용을 표준화하는 과정에 LLM을 활용할 수 있다. 이러한 일은 사람이 하나하나 단어를 선정하기에는 소모적이고, 양에 따라 매우 방대할 수 있기 때문에 LLM을 사용하여 빠르고 효과적으로 문제를 해결할 수 있다. 본 연구에서는 LLM모델을 이용하여 HAZOP에서 작성된 문구들을 표준화하도록 하였으며, 표준화된 데이터를 토대로 다중출력 회귀모델을 이용하여 결과를 추정하였다.

마지막으로는 LLM 모델을 이용하여 직접 빈도와 강도를 예측하는 방법으로 공개된 LLM이 이탈, 원인, 결과, 현재 조치사항의 문맥을 이해하고 이에 따라 빈도와 강도를 예측하는 방법이다. 현재 공개된 LLM 모델은 충분히 제시된 정보만을 토대로 어떤 시스템에 대한 내용인지 유추가 가능하고, 이를 토대로 발생 가능한 이슈와 이에 따른 결과의 인과관계를 이해할 수 있다. 따라서, LLM 모델에 Train Data로부터 획득한 정보를 토대로 빈도와 강도를 유추하도록 하는 프롬프트를 작성하였으며, 이것을 토대로 LLM이 직접 Test Data로부터 빈도와 강도를 유추하였다. 이 방식은 LLM의 사이즈와 LLM이 학습된 배경에 크게 의존한다. 따라서, 8B급 모델보다 70B급 모델이, 더욱이는 405B급 모델이 더 높은 이해도를 가질것으로 생각된다. 현재 수준에서 개인 연구자의 로컬 PC에서 구동가능한 규모가 8B급임을 고려하면 합리적인 시도 가능한 방안이라 생각되며, GPU 성능개선, 소형 LLM 모델의 고도화를 고려한다면, 이러한 방법이 추후 활용될 가능성이 농후하다. 더욱이 멀티 모달 AI의 성능이 고도화됨에 따라 PFD, P&ID 수준부터 이미지와 대형 언어모델의 멀티 모달 AI가 HAZOP 분석 활용될 것으로 생각하면, 장기적으로는 AI를 직접 이용하는 방법이 기존의 정성적 위험성 평가 절차를 대체하거나 보조하는 새로운 표준으로 발전할 가능성이 높다.


3. 결 과

Fig. 2는 전통적인 머신러닝 기법을 이용하여 HAZOP의 빈도와 강도를 예측한 결과를 나타낸 것이다. 입력된 이탈, 원인, 결과, 현재 안전조치의 문자열 데이터를 TF-IDF기법으로 벡터화한 후, 다중출력 로지스틱 회귀모델을 학습하여 예측을 수행하였다.


Fig. 2. 
Confusion matrix of multioutput logistic regression model for (a) frequency and (b) severity

Fig. 2(a)에서 확인할 수 있듯이, 빈도 예측의 경우 대부분의 데이터가 실제 라벨과 동일하게 분류되었으며, 특히 Class 2의 정확도가 매우 높게 나타났다(92 % 이상). Class 2에 높은 정확도를 보이는 이유는 모델의 추정성능과 별도로 Class 2에 집중된 데이터 수도 큰 영향을 미친다. HAZOP의 특성상 P&ID 수준으로 완성도 높은 시스템에 대하여 다양한 발생 가능한 시나리오를 검토하는데, 이러한 시스템에서는 높은 빈도와 강도로 발생이 예상되는 시나리오는 안전 설비를 구축함으로써 대게 미리 예방된다. 따라서, Class 1과 2, 3 수준에서 데이터가 집중된다. 이러한 데이터 불균일 문제는 머신러닝 모델의 편향, 과적합, 왜곡을 불러일으킬 수 있다. 본 연구에서 제한된 데이터를 증강함으로서 모델의 안정성을 개선하였다면, 이러한 데이터 불균일 문제는 비대칭적 증강을 통하여 보완될 수 있다. 그러나, 본 연구에서는 이러한 부분은 다루지 않으며, 더 고도화된 머신러닝 모델을 위해서는 다양한 HAZOP 분석 데이터 확보가 필수적이다.

강도 예측 결과(Fig. 2(b))에서도 Class 1과 2는 100 %의 정확도를 보였고, Class 3과 4에서 약간의 오분류가 존재하나 전반적인 예측 성능은 우수하였다. 이는 전통적 TF-IDF와 로지스틱 회귀 조합만으로도 명확한 패턴을 보이는 문장은 효과적으로 구분할 수 있음을 의미한다. 다만, 데이터 내 비표준화된 표현(예: ‘질소’, ‘N2’, ‘LN2’ 등)이 혼재되어 있어 일부 혼동이 발생한 것으로 판단된다.

Fig. 3은 LLM 모델을 데이터 전처리 단계에 활용하여 HAZOP 데이터의 표현을 표준화한 뒤, 동일한 다중출력 로지스틱 회귀모델을 이용해 예측한 결과를 나타낸 것이다. LLM 모델을 통해 비표준화된 용어나 문장 구조를 일관된 형식으로 변환함으로써, 학습 데이터의 품질이 향상되었다.


Fig. 3. 
Confusion matrix of multioutput logistic regression with LLM based data process for (a) frequency and (b) severity

Fig. 3(a)에서 볼 수 있듯이, 빈도 예측에서 Class 2의 정확도가 기존 22개에서 23개로 증가하였으며, 전체적인 오분류가 감소하였다. 강도 예측 결과(Fig. 3(b))는 Class 3과 4에서 여전히 일부 혼동이 존재하나, 전반적인 일관성이 향상되었다. 사람에의 작성된 텍스트이기 때문에 동일한 지칭이라도 다른 텍스트로 작성될 수 있고, 이런 문제가 LLM을 통하여 데이터 개선을 이뤄낼 수 있음을 확인하였다. 여전히 혼동을 발생하는 부분은 LLM을 통한 데이터 처리에서 혼동을 줄이기 위한 개선이 반영되지 않은 부분으로 앞선 일반 다중출력 로지스틱 회귀모델의 결과와 같게 된다. 따라서, 머신로닝을 단독 예측 모델로 사용하는 것보다, LLM을 전통적 머신러닝 모델의 입력 데이터 정제 도구로 활용하는 것 가능함을 확인하였다.

Fig. 4는 LLM 모델이 직접 HAZOP 문장을 입력받아 빈도와 강도를 예측한 결과를 보여준다. 이 방법은 LLM의 언어 이해력을 기반으로 각 문장의 문맥적 의미를 해석하여 위험도를 추정하는 방식이다.


Fig. 4. 
Confusion matrix of direct LLM inference model for (a) frequency and (b) severity

Fig. 4(a)4(b)에서 확인할 수 있듯이, LLM 모델은 전반적으로 주요 클래스(Class 2, 3, 4)에 대해 상대적인 경향성은 잘 파악하였으나, 세부적인 수치 분류 정확도는 다소 낮게 나타났다. 특히 빈도 예측에서는 Class 1과 2 사이의 혼동이 빈번하게 발생하였고, 강도 예측에서도 중간 등급(Class 2∼4) 간 구분이 불명확하였다. 이는 8B 규모의 LLM이 제한된 파라미터 크기와 수치적 분류 학습 경험의 부족으로 인해 정량적 구분 능력이 충분하지 않기 때문으로 판단된다.

그럼에도 불구하고 LLM 모델이 사전학습된 문맥 이해 능력을 바탕으로 의미적 유사성을 반영하는 결과를 보였다는 점에서, 향후 70B 이상의 대규모 LLM 모델이나 멀티모달 AI 모델이 적용될 경우 HAZOP 자동분석의 정성적·정량적 예측 성능이 크게 향상될 것으로 기대된다.

Table 1은 모델별 빈도와 강도에 대한 예측 정확도를 나타낸다. 머신러닝 기반의 방법들은 강도 예측의 정확도가 빈도 예측보다 높게 나타나는 경향을 보였으며, LLM 직접 예측의 경우 빈도가 강도보다 높은 정확도를 보였다. 이는 빈도의 데이터가 Class 1에서 3에 집중되어, 특히 Class 2에 집중되어 있어 예측 결과도 Class 2에 집중되면서 낮은 정확도를 보인 것으로 판단되며, 오히려 강도의 경우 다양한 데이터를 가지고 있어 집중되지 않아 높은 정확도를 보인 것으로 판단된다. LLM 직접 모델에서는 오히려 반대로 Class 1에서 3에 집중된 데이터들로 인해 예측의 범위가 줄어들어 강도에 비하여 높은 정확도를 가진 것으로 판단되며, 강도의 경우 상대적으로 데이터가 분포되어 있는 특성으로 인하여 문맥기반의 추정에 정확도가 낮았던 것으로 판단된다.

Table 1. 
Percentage prediction accuracy of each model
Model Frequency [%] Severity [%]
Multioutput logistic regression model 87.50% 93.75%
Multioutput logistic regression model with LLM based data process 90.63% 93.75%
Direct LLM inference model 75.00% 53.13%

HAZOP의 빈도와 강도를 추정하기 위해서는 더 많고, 신뢰성 있는 데이터가 요구된다. 그러나 HAZOP 분석 데이터는 실제 산업 시스템에서 도출된 제한적 사례를 기반으로 하므로, 클래스 간 데이터 불균형이 존재하였다. 본 연구에서는 제한적인 데이터로 인하여, 특히, 빈도 및 강도 4, 5 등 고등급 위험 상황의 데이터가 매우 적어, 모델이 이를 일반화하기는 어려웠으나, 방법론 측면에서의 HAZOP의 예측 및 나아가 LLM의 활용 가능성을 검토하였다는 점에서 의의가 있다.

이러한 데이터적인 한계를 극복하기 위해 고온 수전해 뿐만 아닌 연료전지, 수소 활용 설비 등 다양한 에너지 시스템에서의 HAZOP 분석 통합이 필요하다.


4. 결 론

본 연구는 SOEC 시스템을 대상으로 HAZOP의 빈도와 강도를 예측하기 위한 머신러닝 모델 및 LLM 기반 분석 접근을 제안하였으며, 텍스트 중심의 HAZOP 데이터를 효과적으로 활용하기 위한 고도화된 방법을 제시하였다. 연구 결과, 다중출력 로지스틱 회귀 모델은 두 위험 등급을 동시에 추정함에도 높은 예측 정확도와 안정적인 재현성을 보였고, LLM을 활용한 텍스트 전처리는 의미적 정보의 품질을 향상시켜 머신러닝 모델 성능을 개선하는 것으로 나타났다. 또한 LLM이 HAZOP의 편차–원인–결과 간 문맥적 관계를 효과적으로 파악하여 의미 기반 특징을 생성할 수 있음이 확인되었으며, 나아가 LLM 단독으로 빈도와 강도를 직접 추론할 수 있는 잠재력도 관찰되었다. 이러한 결과는 LLM이 HAZOP 수행자의 경험 의존성과 분석 편차를 줄이는 도구로 활용될 수 있으며, 로컬 환경에서의 구동을 통해 민감 데이터의 보안성과 기술적 독립성을 동시에 확보할 수 있음을 보여준다. 향후 고성능 LLM 모델의 보급과 연산 자원 향상에 따라, 본 연구에서 제안한 접근법은 SOEC 시스템을 비롯한 다양한 공정 시스템의 HAZOP 자동화에 적용되어 더욱 높은 정확도와 실용성을 갖춘 지능형 안전성 평가 체계로 확장될 것으로 기대된다.

나아가, LLM 모델뿐만 아니라 멀티모달 형태의 AI가 에너지 시스템의 텍스트 기반 및 이미지 형태 데이터들이 정량화하고 실제 연구 및 업무에 활용될 수 있을 것으로 생각된다.


Acknowledgments

본 연구성과는 한국기계연구원 기관 기본사업(Project ID : NK254D)의 지원과 2024년도 정부(과학기술정보통신부)의 재원으로 한국연구재단 H2 Next Round 사업의 지원을 받아 수행된 연구임(RS-2024-00467191).


References
1. S. Han, J. Park, S. Lee, B. Kong, H. Song, G. Park, and Y. Kim, “A study on the development of technical standards to ensure the safety and reliability of solid oxide electrolysis cell technology”, Journal of Hydrogen and New Energy, Vol. 36, No. 4, 2025, pp. 380-389.
2. D. Seo, K. Rhie, D. Lee, D. Shin, H. Kim, C. Lee, and T. Kim, “A study on the application of hazard libraries when using HAZOP in hydrogen systems”, Journal of Hydrogen and New Energy, Vol. 34, No. 4, 2023, pp. 381-387.
3. D. Shin, S. Hong, K. Rhie, D. Seo, D. Lee, and T. Kim, “Risk assessment for the integrated system of hydrogen generation system linked to fuel cell”, Journal of Hydrogen and New Energy, Vol. 34, No. 6, 2023, pp. 728-733.
4. D. Shin, S. Hong, G. Rhie, D. Lee, H. Kim, and D. Seo, “Risk assessment for fuel cell demonstration facility linked to hydrogen extractor to create a safe operation manual”, Journal of Hydrogen and New Energy, Vol. 35, No. 5, 2024, pp. 469-474.
5. Y. B. Gu and C. M. Lee, “A HAZOP risk assessment study for the application of hydrogen fuel in a gas turbine combined cycle power plant”, Journal of Hydrogen and New Energy, Vol. 35, No. 5, 2024, pp. 572-582.
6. H. Kim, T. Kim, K. Rhie, D. Seo, and D. Lee, “Deduction of emergency stop situation factors for water electrolysis facilities”, Journal of Hydrogen and New Energy, Vol. 34, No. 6, 2023, pp. 722-727.
7. S. Yeo, D. Seo, K. Rhie, T. Kim, and H. Kim, “deduction of potential risk factors for solid oxide water electrolysis facilities”, Proceedings of the Spring Conference of the Korean Institute of Gas, 2023.
8. H. K. Kim, D. H. Seo, K. W. Rhie, T. H. Kim, and S. C. Hong, “Research on Safety Measures for Design and Operation of Alkaline Water Electrolysis Facility”, Journal of the Korean Institute of Gas, Vol. 28, No. 2, 2024, pp. 17-23.
9. S. Han, J. Park, S. Lee, B. Kong, H. Song, G. Park, and Y. Kim, “A study on the development of technical standards to ensure the safety and reliability of solid oxide electrolysis cell technology”, Journal of Hydrogen and New Energy, Vol. 36, No. 4, 2025, pp. 380-389.
10. M. F. Theisen, K. N. Flores, L. S. Balhorn, and A. M. Schweidtmann, “Digitization of chemical process flow diagrams using deep convolutional neural networks”, Digital Chemical Engineering, Vol. 6, 2023, pp. 100072.
11. G. Vogel, L. S. Balhorn, and A. M. Schweidtmann, “Learning from flowsheets: a generative transformer model for autocompletion of flowsheets”, Computers & Chemical Engineering, Vol. 171, 2023, pp. 108162.
12. G. Vogel, L. S. Balhorn, E. Hirtreiter, and A. M. Schweidtmann, “SFILES 2.0: an extended text-based flowsheet representation”, Optimization and Engineering, Vol. 24, 2023, pp. 2911-2933.