การจัดการวัตถุดิบคงคลังของร้านอาหาร โดยใช้ Porximal policy optimization
Files
Publisher
Issued Date
2020
Issued Date (B.E.)
2563
Available Date
Copyright Date
Resource Type
Series
Edition
Language
tha
File Type
application/pdf
No. of Pages/File Size
62 แผ่น
ISBN
ISSN
eISSN
Other identifier(s)
b212263
Identifier(s)
Access Rights
Access Status
Rights
ผลงานนี้เผยแพร่ภายใต้ สัญญาอนุญาตครีเอทีฟคอมมอนส์แบบ แสดงที่มา-ไม่ใช้เพื่อการค้า-ไม่ดัดแปลง 4.0 (CC BY-NC-ND 4.0)
Rights Holder(s)
Physical Location
สถาบันบัณฑิตพัฒนบริหารศาสตร์. สำนักบรรณสารการพัฒนา
Bibliographic Citation
Citation
ณัฐวัฒน์ เอกธรรมนิตย์ (2020). การจัดการวัตถุดิบคงคลังของร้านอาหาร โดยใช้ Porximal policy optimization. Retrieved from: https://repository.nida.ac.th/handle/662723737/5539.
Title
การจัดการวัตถุดิบคงคลังของร้านอาหาร โดยใช้ Porximal policy optimization
Alternative Title(s)
Porximal policy optimization on casual restaurant raw
material stock
Author(s)
Advisor(s)
Editor(s)
item.page.dc.contrubutor.advisor
Advisor's email
Contributor(s)
Contributor(s)
Abstract
งานวิจัยนี้มีวัตถุประสงค์ในการจัดทำขึ้นเพื่อศึกษาหลักการ Proximal Policy Optimization ของกระบวนการ Reinforcement Learning ในการสร้างแบบจำลองการพยากรณ์จำนวนการสั่งวัตถุดิบของร้านอาหาร เนื่องมาจากปัญหาการสั่งวัตถุดิบของร้านอาหารในแต่ละวัน เกิดความคลาดเคลื่อนจากจำนวนการใช้วัตถุดิบจริงสูง วัตถุดิบที่เหลือจึงกลายเป็นขยะอาหาร ทำให้เกิดการหมักและก่อตัวเป็นก๊าซมีเทนลอยขึ้นไปทำลายโอโซนในชั้นบรรยากาศ โดยแบ่งการศึกษาออกเป็น 2 รูปแบบหลักๆ คือ 1. แบบจำลองแบบหนึ่งแอตทริบิวต์ 2. แบบจำลองแบบหลายแอตทริบิวต์ และชุดข้อมูลจำลองที่ใช้มาจากการจำลองโดยอาศัยหลักการจำลองข้อมูลแบบแจกแจงปกติ ส่วนการประเมินประสิทธิภาพของแบบจำลองจะใช้เครื่องมือ 3 อย่าง คือ F-Statistics ,R-Square และRMSE ในการศึกษาครั้งนี้แต่ละแบบจำลองจะมีการเรียนรู้ทั้งหมด 12 ล้านไทม์สเต็ป ผลจากการศึกษาในงานวิจัยนี้ พบว่า ในการเรียนรู้ของแบบจำลองทั้งหมด 12 ล้านไทม์สเต็ป แบบจำลองแบบหลายแอตทริบิวต์ จะเกิดการลู่เข้าหาค่าที่เหมาะสมของแบบจำลอง ได้เร็วกว่าแบบจำลองแบบหนึ่งแอตทริบิวต์ และประสิทธิภาพของค่าความถูกต้องในการพยากรณ์จำนวนการสั่งวัตถุดิบ อยู่ที่ร้อยละ 82 ของค่าการพยากรณ์ทั้งหมด จากงานวิจัยนี้ทำให้ทราบถึงแนวทางในการนำหลักการ Proximal Policy Optimization ไปสร้างแบบจำลองการพยากรณ์จำนวนการสั่งวัตถุดิบ ให้สามารถพยากรณ์จำนวนวัตถุดิบที่จะสั่ง ได้ใกล้เคียงกับจำนวนวัตถุดิบที่ใช้จริงมากที่สุด และสามารถลดจำนวนขยะอาหารให้มีจำนวนเหลือน้อยลง
This research focuses on the Proximal Policy Optimization Algorithm (PPO) of Reinforcement Learning to make a forecasting model of raw material stock in restaurants. The restaurant's daily raw material stock ordered and the number of raw material stock used fluctuates daily. The unused raw material stock is left as wasted material. It caused fermentation and produced methane gas that rises to destroy ozone into the atmosphere. This research investigated a One-Attribute Model and a Multi-Attribute Model. The dataset used in this research is synthetic data that use the normal distribution theory to make it. The model's performance was assessed using F-statistics, R-Square, and RMSE. We trained each model trained 12 million timesteps. The result showed that the Multi-Attribute Model would converge to the value optimization faster than the One-Attribute Model. We found that both models' accuracy is about 82 percent. This research demonstrated that the PPO Algorithm could be utilized to make an effective raw material forecasting tool.
This research focuses on the Proximal Policy Optimization Algorithm (PPO) of Reinforcement Learning to make a forecasting model of raw material stock in restaurants. The restaurant's daily raw material stock ordered and the number of raw material stock used fluctuates daily. The unused raw material stock is left as wasted material. It caused fermentation and produced methane gas that rises to destroy ozone into the atmosphere. This research investigated a One-Attribute Model and a Multi-Attribute Model. The dataset used in this research is synthetic data that use the normal distribution theory to make it. The model's performance was assessed using F-statistics, R-Square, and RMSE. We trained each model trained 12 million timesteps. The result showed that the Multi-Attribute Model would converge to the value optimization faster than the One-Attribute Model. We found that both models' accuracy is about 82 percent. This research demonstrated that the PPO Algorithm could be utilized to make an effective raw material forecasting tool.
Table of contents
Description
วิทยานิพนธ์ (วท.ม. (การวิเคราะห์ข้อมูลและวิทยาการข้อมูล))--สถาบันบัณฑิตพัฒนบริหารศาสตร์, 2563