AI 教室監視系統製作 - 課程作業參考答案

1. AI 教室監視系統製作

本專題旨在建置一套「AI 教室監視系統」，透過電腦視覺與人工智慧模型，對教室中的即時影像進行分析。系統整合 Web Camera、YOLO 物件偵測、 MediaPipe 手部偵測、Face Mesh 臉部網格偵測，以及疲勞偵測功能，可作為智慧教室、出席觀察、教學示範與 AI 應用練習之基礎平台。

系統目標：
1. 可即時讀取攝影機畫面。
2. 可辨識人員與物件。
3. 可分析手部與臉部特徵。
4. 可進行疲勞狀態初步判斷。
5. 可在網頁上顯示即時監控資訊、事件時間軸與偵測標記。

系統應用情境

智慧教室出席與活動狀態觀察
學生專題成果展示
AI 影像辨識教學範例
邊緣運算與即時視覺分析練習

【可放置系統主畫面截圖】
例如：即時影像畫面、辨識框、事件訊息畫面

2. 資訊專案結構（說明）

本專案使用 Python 作為後端影像處理語言，搭配 HTML/CSS 作為前端展示介面，專案結構如下：

資料夾 / 檔案	功能說明
`app.py`	主程式，負責啟動 Flask 伺服器與影像串流
`templates/index.html`	前端主頁面，顯示監控畫面與系統資訊
`static/style.css`	前端樣式設計
`models/`	存放 YOLO 權重檔或其他 AI 模型
`utils/camera.py`	攝影機讀取模組
`utils/yolo_detect.py`	YOLO 物件辨識模組
`utils/hand_detect.py`	MediaPipe 手部偵測模組
`utils/face_mesh.py`	臉部網格偵測模組
`utils/fatigue_detect.py`	疲勞偵測模組，判斷閉眼或打哈欠
`logs/`	事件紀錄、時間軸資料

說明重點： 學生在此段應能表達每個檔案的用途，顯示其了解整體系統是由哪些模組組成，而不是只會執行單一程式。

3. 資訊系統環境圖（UML）

本系統以使用者、Web 介面、Python 後端、AI 模型模組與攝影機設備為主要元件，系統環境圖如下：

AI 教室監視系統 UML / 環境流程圖

使用者

→

HTML 網頁介面

→

Flask 後端

→

Web Camera

YOLO 偵測

←

影像分析模組

→

MediaPipe 手部 / 臉部

疲勞分析

→

事件紀錄與時間軸

→

結果顯示

系統環境說明

輸入端：USB Web Camera 或筆記型電腦內建攝影機
處理端：Python + OpenCV + MediaPipe + YOLO
輸出端：瀏覽器顯示影像、事件框與分析結果
紀錄端：事件時間軸、偵測標示、統計資訊

【可替換成 draw.io、StarUML 或 PowerPoint 繪製的正式 UML 圖】

4. 功能測試一：Web Camera

本測試目標為確認系統是否能正確啟動攝影機，並將畫面即時傳送到網頁介面中。在測試過程中，系統成功讀取攝影機畫面，顯示教室現場影像，更新速度正常。

測試目的

確認攝影機可被系統辨識與存取，並可提供穩定的影像來源。

測試結果

攝影機成功開啟，畫面可正常顯示於網頁，延遲約 0.2 至 0.5 秒。

測試步驟

接上 Web Camera
執行 Python 主程式
開啟瀏覽器進入系統首頁
確認畫面是否正常顯示

【插入 Web Camera 測試截圖】

5. 功能測試二：YOLO

YOLO（You Only Look Once）是一種即時物件偵測模型，本系統使用 YOLO 對教室畫面中的人、椅子、書包、電腦等物件進行辨識，並在畫面中以方框與標籤顯示結果。

測試項目	內容
模型名稱	YOLOv8 / YOLOv5（依學生實作版本填寫）
辨識物件	person、chair、backpack、laptop 等
顯示方式	偵測框 + 類別名稱 + 信心值
測試結論	可即時辨識教室內主要目標物件，但在遮擋或光線不足時準確度下降

分析： YOLO 適合用於即時監控場景，因其速度快、辨識能力佳，但若教室內物件重疊或畫面角度不佳，可能造成誤判或漏判。

【插入 YOLO 偵測畫面截圖】

6. 功能測試三：手部偵測（MediaPipe）

本功能利用 MediaPipe Hands 偵測手部關鍵點，可辨識手掌輪廓與手指關節位置。此功能可延伸應用於手勢控制、舉手辨識或互動教學。

測試內容

偵測單手與雙手
顯示手掌骨架線條
標示各手指關鍵點

測試結果

系統在良好光線條件下可穩定辨識手部位置，當手部快速移動或被遮擋時，部分關鍵點可能短暫消失。

【插入手部偵測截圖】

7. 功能測試四：臉部網格偵測

本系統使用 MediaPipe Face Mesh 進行臉部特徵點偵測，可在臉部上標示大量網格節點，用來分析眼睛、嘴巴與臉部輪廓。

功能用途

提供後續疲勞偵測、表情辨識、視線觀察等進階分析基礎。

測試結論

正面臉辨識效果佳，若側臉角度太大，部分特徵點可能偏移。

限制： 若配戴口罩、光線太暗、鏡頭距離過遠，可能會影響網格點穩定度。

【插入 Face Mesh 臉部網格截圖】

8. 功能測試五：疲勞偵測

疲勞偵測主要透過臉部特徵點分析眼睛開闔程度與嘴巴張開情況，判斷是否出現閉眼過久、打哈欠等疲勞現象。

判斷依據

眼睛長時間閉合：可能表示打瞌睡或精神不集中
嘴巴張開幅度過大：可能表示打哈欠
頭部持續低垂：可能表示疲勞或注意力下降

判斷項目	說明
閉眼偵測	利用雙眼特徵點距離估算眼睛開合程度
打哈欠偵測	利用嘴部關鍵點距離計算張嘴比例
疲勞警示	若閉眼或哈欠超過門檻，於畫面上顯示警示文字

【插入疲勞偵測截圖】

9. 全統功能

本系統將前述功能整合為完整 AI 教室監控平台，除了即時影像顯示外，亦加入事件記錄、標示與統計分析功能，使系統更接近實際資訊系統應用。

9.1 即時影像串流

使用攝影機持續取得畫面，經由後端處理後傳送至網頁頁面，使使用者可即時觀察教室狀況。

9.2 物件資訊顯示框

對辨識到的人或物件加上方框，並顯示物件名稱與信心值，方便使用者快速判讀系統辨識結果。

9.3 事件時間軸（Event Timeline）

09:10:12 YOLO
偵測到 person × 3

09:10:18 Hand
偵測到舉手動作

09:10:25 Face Mesh
臉部特徵點成功追蹤

09:10:31 Fatigue
疲勞事件：疑似閉眼過久

9.4 事件標示

當系統偵測到特定事件時，例如人數增加、手勢出現、疲勞警示等，即可在畫面上用文字或顏色進行標示，提升監控可讀性。

9.5 其他功能：人數或車數計算

本系統可延伸計算畫面中的人數。若應用在校園停車場、道路或戶外監控，亦可改為計算車輛數量，作為智慧監控的擴充應用。

整體成果： 本專題不只是單一辨識程式，而是將多個 AI 模組整合成一個可視化資訊系統，具備前端展示、後端運算、即時處理與事件記錄等特色。

【插入系統整合畫面截圖】

10. 使用 AI 工具對話連結（例：Gemini）

在本專題開發過程中，我有使用 AI 工具協助撰寫程式、修正錯誤與理解套件功能。例如：請 AI 協助說明 OpenCV 攝影機讀取、YOLO 安裝方式、MediaPipe 使用方法、 Flask 網頁串流寫法與錯誤排除。

使用方式

請 AI 協助產生基礎程式碼
請 AI 解釋錯誤訊息
請 AI 協助整理專案架構與報告內容
請 AI 幫助優化 HTML/CSS 網頁版面

對話連結範例： Gemini 對話平台

說明： 學生應誠實註明 AI 工具的使用方式，重點不是完全照抄，而是能理解並修改成自己的版本。

11. Trouble Shooting 與學習心得

Trouble Shooting

遇到問題	原因分析	解決方式
攝影機無法開啟	可能被其他程式占用，或設備編號錯誤	確認攝影機索引值，重新插拔設備，關閉其他使用鏡頭的程式
YOLO 模型無法載入	權重路徑錯誤或套件未安裝完整	重新確認模型路徑，安裝 ultralytics 或對應版本套件
MediaPipe 無法匯入	Python 環境版本不相容	重建虛擬環境，改用相容版本安裝 mediapipe
網頁無法顯示即時畫面	Flask 串流格式錯誤或路由未設定完成	檢查 `video_feed` 路由與 JPEG 串流格式
疲勞偵測不穩定	臉部角度或光線影響特徵點辨識	改善照明、調整鏡頭位置、重新設定判斷門檻

學習心得

透過本次作業，我學到如何把多個人工智慧模組整合成一套完整系統，不再只是單獨執行某個辨識程式，而是從「攝影機輸入、AI 分析、網頁顯示、事件記錄」的角度思考整體系統設計。

在實作過程中，我也發現影像辨識不只與程式有關，還與光線、鏡頭角度、電腦效能、套件版本等因素密切相關。這讓我更了解資訊系統開發需要整合軟體、硬體與測試能力。

此外，我利用 AI 工具協助我理解錯誤訊息與整理程式架構，提高了開發效率，也讓我學會如何與 AI 協作完成專題。未來若能再加入資料庫、使用者登入、事件查詢與雲端通知功能，系統將更接近真實應用。

結論

本作業完成了一套以 AI 教室監視系統為主題的資訊系統展示網頁，內容涵蓋系統介紹、專案結構、UML 環境圖、Web Camera、YOLO、MediaPipe 手部偵測、 Face Mesh 臉部網格、疲勞偵測、整合功能、AI 工具使用說明以及問題排除與學習心得。

本作品展現出人工智慧在教室監控、影像辨識與資訊整合上的應用潛力，也反映學生對於前後端整合、系統分析與專案實作能力的掌握程度。

1. AI 教室監視系統製作

系統應用情境

2. 資訊專案結構（說明）

3. 資訊系統環境圖（UML）

系統環境說明

4. 功能測試一：Web Camera

測試目的

測試結果

測試步驟

5. 功能測試二：YOLO

6. 功能測試三：手部偵測（MediaPipe）

測試內容

測試結果

7. 功能測試四：臉部網格偵測

功能用途

測試結論

8. 功能測試五：疲勞偵測

判斷依據

9. 全統功能

9.1 即時影像串流

9.2 物件資訊顯示框

9.3 事件時間軸（Event Timeline）

9.4 事件標示

9.5 其他功能：人數或車數計算

10. 使用 AI 工具對話連結（例：Gemini）

使用方式

11. Trouble Shooting 與 學習心得

Trouble Shooting

學習心得

結論

11. Trouble Shooting 與學習心得