fbpx

Мэдрэлийн сүлжээ, хиймэл мэдрэлийн сүлжээ (ANN) эсвэл симуляцсан мэдрэлийн сүлжээ (SNN) гэж нэрлэгддэг мэдрэлийн сүлжээ нь машин сургалтын нэг хэсэг бөгөөд гүн сургалтын алгоритмуудын гол цөм юм. Тэдний нэр, бүтэц нь хүний ​​тархинаас санаа авч, биологийн мэдрэлийн эсүүд бие биедээ дохио өгдөгийг дуурайдаг.

Хиймэл мэдрэлийн сүлжээ (ANN) нь оролтын давхарга, нэг буюу хэд хэдэн далд давхарга, гаралтын давхарга агуулсан зангилааны давхаргаас бүрдэнэ. Зангилаа бүр буюу хиймэл нейрон нь нөгөөтэй холбогдож, жин, босготой байдаг. Хэрэв аль нэг зангилааны гаралт нь тогтоосон босго утгаас давсан бол тухайн зангилаа идэвхжиж, сүлжээний дараагийн давхарга руу өгөгдөл илгээдэг. Үгүй бол сүлжээний дараагийн давхаргад өгөгдөл дамжуулахгүй.

Мэдрэлийн сүлжээнүүд нь сургалтын өгөгдөлд тулгуурлан суралцаж, цаг хугацааны явцад нарийвчлалыг сайжруулдаг. Гэсэн хэдий ч, эдгээр сургалтын алгоритмуудыг нарийвчлалын үүднээс нарийн тохируулсны дараа тэдгээр нь компьютерийн шинжлэх ухаан болон хиймэл оюун ухаанд хүчирхэг хэрэгсэл болж, өгөгдлийг өндөр хурдтайгаар ангилж, ангилах боломжийг олгодог. Яриа таних эсвэл дүрсийг таних ажил нь хүний ​​​​мэргэжилтнүүдийн гараар танихтай харьцуулахад хэдэн минут, хэдэн цаг зарцуулдаг. Хамгийн алдартай мэдрэлийн сүлжээнүүдийн нэг бол Google-ийн хайлтын алгоритм юм.

МЭДРЭЛИЙН СҮЛЖЭЭНҮҮД ХЭРХЭН АЖИЛЛАДАГ ВЭ?

Зангилаа бүрийг оролтын өгөгдөл, жин, хазайлт (эсвэл босго), гаралт зэргээс бүрдэх өөрийн шугаман регрессийн загвар гэж бод. Томъёо нь иймэрхүү харагдах болно.

∑wixi + bias = w1x1 + w2x2 + w3x3 + bias

output = f(x) = 1 if ∑w1x1 + b>= 0; 0 if ∑w1x1 + b < 0

Оролтын давхаргыг тодорхойлсны дараа жинг онооно. Эдгээр жин нь өгөгдсөн хувьсагчийн ач холбогдлыг тодорхойлоход тусалдаг бөгөөд том хувьсагч нь бусад оролттой харьцуулахад гарцад илүү их хувь нэмэр оруулдаг. Дараа нь бүх оролтыг тус тусын жингээр үржүүлж, дараа нь нэгтгэнэ. Үүний дараа гаралтыг идэвхжүүлэх функцээр дамжуулдаг бөгөөд энэ нь гаралтыг тодорхойлдог. Хэрэв энэ гаралт нь өгөгдсөн босго хэмжээнээс давсан бол энэ нь сүлжээний дараагийн давхаргад өгөгдлийг дамжуулж, зангилааг “идэвхижүүлэлт” (эсвэл идэвхижүүлэлт) болгоно. Үүний үр дүнд нэг зангилааны гаралт дараагийн зангилааны оролт болж хувирна. Нэг давхаргаас дараагийн давхаргад өгөгдөл дамжуулах энэ үйл явц нь энэ мэдрэлийн сүлжээг дамжуулах сүлжээ гэж тодорхойлдог.

МЭДРЭЛИЙН СҮЛЖЭЭНИЙ ТӨРЛҮҮД

Мэдрэлийн сүлжээг өөр өөр зорилгоор ашигладаг өөр өөр төрөлд ангилж болно. Хэдийгээр энэ нь төрлүүдийн иж бүрэн жагсаалт биш ч, доор дурдсан нь нийтлэг хэрэглээний тохиолдлуудад тааралддаг мэдрэлийн сүлжээнүүдийн хамгийн түгээмэл төрлүүдийг төлөөлөх болно.

Перцептрон бол 1958 онд Фрэнк Розенблаттын бүтээсэн хамгийн эртний мэдрэлийн сүлжээ юм.

Дамжуулах мэдрэлийн сүлжээ буюу олон давхаргат мэдрэгч (MLP) нь бидний энэ нийтлэлд гол анхаарлаа хандуулсан зүйл юм. Эдгээр нь оролтын давхарга, далд давхарга эсвэл давхарга, гаралтын давхаргаас бүрдэнэ. Эдгээр мэдрэлийн сүлжээг ихэвчлэн MLP гэж нэрлэдэг боловч бодит ертөнцийн ихэнх асуудлууд шугаман бус байдаг тул тэдгээр нь мэдрэгч биш харин сигмоид мэдрэлийн эсүүдээс бүрддэг гэдгийг анхаарах нь чухал юм. Мэдээллийг сургах зорилгоор эдгээр загварт ихэвчлэн оруулдаг бөгөөд тэдгээр нь компьютерийн хараа, байгалийн хэлний боловсруулалт болон бусад мэдрэлийн сүлжээний үндэс суурь болдог.

Convolutional Neural Networks (CNNs) нь дамжуулах сүлжээтэй төстэй боловч ихэвчлэн дүрсийг таних, хэв маягийг таних болон/эсвэл компьютерийн хараанд ашигладаг. Эдгээр сүлжээнүүд нь зураг доторх хэв маягийг тодорхойлохын тулд шугаман алгебр, ялангуяа матрицын үржүүлгийн зарчмуудыг ашигладаг.

Давтагдах мэдрэлийн сүлжээ (RNN) нь тэдгээрийн эргэх холбоогоор тодорхойлогддог. Эдгээр сургалтын алгоритмууд нь хөрөнгийн зах зээлийн таамаглал эсвэл борлуулалтын таамаглал гэх мэт ирээдүйн үр дүнгийн талаар таамаглахад цаг хугацааны цуврал өгөгдлийг ашиглахад голчлон ашигладаг.

МЭДРЭЛИЙН СҮЛЖЭЭ БА ГҮН СУРГАЛТ

Deep Learning болон мэдрэлийн сүлжээг харилцан ярианд орлуулах хандлагатай байдаг бөгөөд энэ нь төөрөгдөл үүсгэдэг. Үүний үр дүнд гүн сургалтын суралцах “гүн” гэдэг нь мэдрэлийн сүлжээн дэх давхаргын гүнд л хамаатай гэдгийг тэмдэглэх нь зүйтэй. Оролт, гаралтыг багтаасан гурваас дээш давхаргаас бүрдэх мэдрэлийн сүлжээг гүнзгий гүн сургалтын алгоритм гэж үзэж болно. Зөвхөн хоёр буюу гурван давхаргатай мэдрэлийн сүлжээ нь энгийн мэдрэлийн сүлжээ юм.

Leave a Reply