건설 현장의 정형/비정형 데이터 관리 및 분석 시스템

user icon

KUKJIN LEE 🚀

3개월 전

건설 프로젝트 성공을 위해 데이터는 중요합니다. 건설 현장에서 정형 및 비정형 데이터의 특성, 저장 방법, 분석 기법에 대해서 알아보겠습니다.

 

건설 현장의 데이터 유형

정형 데이터

명확한 의미와 형식을 가지고 있기 때문에 컴퓨터가 쉽게 처리하고 분석할 수 있는 데이터를 뜻합니다. (미리 정의된 구조나 스키마를 뜻함)

  • 공정 진행률
  • 자재 재고 현황
  • 작업자 출근 기록
  • 장비 가동 시간
  • 비용 정보

 

비정형 데이터

다양한 포맷으로 존재하고, 정형 데이터와 비교했을 때 처리와 분석이 복잡합니다. 하지만 풍부한 정보를 포함합니다.

  • 현장 사진 및 동영상
  • 설계 도면

 

데이터 저장 방법

정형 데이터를 사용할 경우, Oracle, MySQL, PostgreSQL 등 테이블 형식으로 데이터를 저장합니다. 대규모 데이터 저장, 분석을 위해 Amazon Redshift, Google BigQuery 등 활용 가능합니다.

 

비정형 데이터를 사용할 경우, Amazon S3, Google Cloud Storage를 통해 현장 사진, 동영상, 스캔 데이터 등 대용량 파일 저장할 수 있으며, NoSQL 데이터베이스 MongoDB등 활용 가능합니다.

 

데이터 분석

정형 데이터 분석

정형 데이터 분석을 위해 통계 분석 도구인 R, Python(pandas 라이브러리) 등을 활용하여 기술 통계, 회귀 분석, 시계열 분석 등을 수행할 수 있습니다. 이를 통해 공정 지연 요인 분석, 비용 예측이 가능해집니다. 또한, 데이터 마이닝 기법을 적용하여 분류, 군집화, 연관 규칙 탐색과 같은 방법으로 안전사고 위험 요인 도출, 자재 소비 패턴 분석을 수행할 수 있습니다.

 

비정형 데이터 분석

비정형 데이터 분석을 위해 다양한 기술과 도구가 활용됩니다. 이미지 및 동영상 분석을 위해 OpenCV, TensorFlow 등의 라이브러리를 사용하여 객체 인식, 이미지 분류 등을 수행할 수 있습니다. 이를 통해 안전장비 착용 여부 확인, 작업 진행 상황 자동 인식 등이 가능해집니다. 텍스트 마이닝 기법을 적용하기 위해 NLTK, spaCy 등의 도구를 활용하여 감성 분석, 토픽 모델링, 개체명 인식 등을 수행할 수 있으며, 이를 통해 작업 일지 분석을 통한 문제점 파악, 안전 보고서 자동 요약 등이 가능합니다. 또한, 음성 데이터 분석을 위해 Google Speech-to-Text, IBM Watson 등의 서비스를 활용하여 음성 인식, 텍스트 변환 등을 수행할 수 있으며, 이를 통해 음성 작업 지시 기록, 회의 내용 자동 문서화 등이 가능해집니다.

 

결론

정형 및 비정형 데이터 특성을 우선 이해하고 적합한 저장 및 분석 방법을 활용하면 건설 현장에서 통계적 분석과 예측이 가능해집니다.

New Tech Posts