کامپیوترفن آوری اطلاعات

بینایی کامپیوتر مدرن است. وظایف و تکنولوژی دید در کامپیوتر است. برنامه نویسی کامپیوتر چشم انداز در پایتون

چگونه برای تدریس به یک کامپیوتر برای درک آنچه که در تصویر و یا تصاویر کشیده شود؟ این ساده به نظر می رسد، اما برای یک کامپیوتر این فقط یک ماتریس متشکل از صفر و آنهایی که از آن شما می خواهید برای استخراج اطلاعات مهم است.

بینایی کامپیوتر چیست؟ این توانایی به "دیدن" کامپیوتر شما می باشد

چشم انداز - یک منبع مهم اطلاعات برای فرد با استفاده از آن است، ما به دست آورد، بر اساس برآوردهای مختلف، از 70 تا 90 درصد از همه اطلاعات و، البته، اگر ما می خواهیم به ایجاد یک ماشین هوشمند، ما نیاز به پیاده سازی مهارت ها و کامپیوتر همان.

مشکل بینایی کامپیوتر را می توان کاملا به وضوح بیان شده است. چه "دیدن"؟ این قابل درک است که که در آن فقط با نگاه وجود دارد. که تفاوت از بینایی کامپیوتر و بینایی انسان به این نتیجه رسیدند. چشم انداز برای ما - آن را به یک منبع دانش در مورد جهان، و همچنین به عنوان یک منبع اطلاعات متریک است - است که، توانایی درک فاصله و اندازه.

تصویر هسته معنایی

با نگاهی به تصویر، ما می توانیم آن را با تعدادی از ویژگی توصیف، پس به صحبت، استخراج اطلاعات معنایی.

به عنوان مثال، به دنبال در این تصویر، می توان گفت که آن را خارج از منزل. ترافیک شهرستان چیست. که اتومبیل وجود دارد. میتوان حدس زد که این جنوب شرق آسیا به پیکربندی ساختمان و هیروگلیف را اختراع است. پرتره از مائو تسه تونگ درک کنند که این پکن است، و اگر هر کسی را دیدم ویدیو زندگی می کنند و یا خود را در آنجا شده بود، حدس می زنم که این معروف میدان تیان آن من است.

آنچه ما می توانیم بیشتر در مورد تصویر می گویند، دیدن آن را؟ ما می توانیم اشیا در تصویر شناسایی، می گویند، که مردم در اینجا نزدیک تر وجود دارد - حصار. در اینجا چتر، پوستر آن ساختمان است. این نمونه هایی از کلاس های اشیاء بسیار مهم، که در جستجو برای لحظه ای مشغول است.

هنوز هم ما می توانیم برخی از ویژگی های و یا صفات اشیاء یاد بگیرند. به عنوان مثال، در اینجا ما می توانیم تعیین که این یک پرتره از یک چینی عادی، یعنی، مائو تسه تونگ نیست.

با توجه به خودرو می تواند تعیین شود که آن را یک جسم در حال حرکت است، و آن سخت است، است که در طول حرکت تغییر شکل نیست. درباره پرچم می توان گفت که آن اشیاء، آنها نیز در حال حرکت است، اما آنها سخت نیست، به طور مداوم تغییر شکل. و در صحنه است باد، که می توان با توسعه پرچم تعیین وجود دارد، و حتی می توانید جهت باد، برای مثال، آن است که وزش باد از چپ به راست تعیین می کند.

فاصله و طول در بینایی کامپیوتر

بسیار مهم اطلاعات متریک در مورد علم بینایی کامپیوتر است. این انواع فاصله است. به عنوان مثال، برای مریخ نورد بسیار مهم است چرا تیم از زمین حدود 20 دقیقه است و جواب به همان اندازه. بر این اساس، از لینک وجود دارد و تماس - 40 دقیقه. و اگر ما را یک برنامه برای دستورات حرکت زمین، شما نیاز به این را به حساب.

موفقیت این فن آوری از بینایی کامپیوتر در بازی های ویدئویی یکپارچه شده است. با توجه به این ویدئو، شما می توانید مدل های سه بعدی از اشیاء، افراد ساخت، و عکس بر روی کاربر می تواند مدل های سه بعدی از شهرستانها بازگرداند. و سپس بر روی آنها راه رفتن.

بینایی کامپیوتر - طیف گسترده ای نه. آن است که نزدیک با علوم مختلف دیگر هم تنیده است. بخشی از بینایی کامپیوتر آن قطاری از منطقه پردازش تصویر و گاهی اوقات اختصاص بینایی کامپیوتر، در طول تاریخ.

تجزیه و تحلیل، تشخیص الگو - مسیر به ایجاد هوش برتر

اجازه دهید ما این مفاهیم به طور جداگانه بررسی کند.

پردازش تصویر - تصویر، و ما باید او انجام کاری - این منطقه از الگوریتم، که در آن ورودی و خروجی است.

تجزیه و تحلیل تصویر - منطقه از بینایی کامپیوتر، که در کار با تصویر دو بعدی و نتیجه گیری از این متمرکز است.

تشخیص الگو - یک رشته انتزاعی ریاضی است که داده ها در فرم از بردار به رسمیت می شناسد. این است که، در ورودی - بردار و ما چیزی برای انجام با آن. که در آن بردار است، ما خیلی مهم است که بدانید نه.

چشم انداز کامپیوتر - آن را در اصل برای بازگرداندن ساختار از تصاویر دو بعدی است. امروز این منطقه گسترده تر تبدیل شده است و می توان آن را به عنوان قبول همه از اشیاء فیزیکی ساخت تفسیر، بر اساس تصویر. این است که، آن کار این است هوش مصنوعی است.

در تصاویر دو بعدی اندازه گیری فاصله بین اشیاء - به موازات با دید رایانه ای در یک میدان کاملا متفاوت است، در علم مساحی، فتوگرامتری تکامل یافته است.

روبات می تواند "دیدن"

و در نهایت - این ماشین بینایی است. تحت بینایی ماشین به این معنی یک چشم انداز از ربات. که این تصمیم برخی از مشکلات تولید است. می توان گفت که بینایی کامپیوتر - یک علم بزرگ است. این ترکیب برخی از بخش علوم دیگر است. و هنگامی که بینایی کامپیوتر می شود هر برنامه خاص، آن را به یک ماشین بینایی به تبدیل می شود.

منطقه بینایی کامپیوتر دارای یک توده از کاربردهای عملی. این است که با اتوماسیون تولید همراه است. در شرکت های موثر تر به جایگزینی کارگران توسط دستگاه. دستگاه خسته نمی شود، خواب نیست، او تا به حال برنامه کار نامنظم، او حاضر به کار 365 روز سال است. بنابراین، با استفاده از دستگاه در حال کار، ما می توانیم یک نتیجه تضمین شده در یک زمان خاص، و آن است بسیار جالب است. همه وظایف یک استفاده روشن برای سیستم بینایی کامپیوتر. و هیچ چیز بهتر از به دیدن نتایج به سرعت در تصویر فقط در مرحله محاسبه وجود دارد.

در آستانه جهان از هوش مصنوعی

به علاوه منطقه - آن را سخت! بخش قابل توجهی از مغز که مسئول بینایی، و اعتقاد بر این است که اگر شما یاد می دهد کامپیوتر خود را به "دیدن"، است که، چشم انداز استفاده از کامپیوتر کامل، آن را یکی از اهداف هوش مصنوعی کامل است. اگر ما می تواند مشکل در سطح بشری را حل کند، به احتمال زیاد در همان زمان، ما این مشکل را از هوش مصنوعی را حل کند. که بسیار خوب است! یا خیلی خوب نیست، اگر شما نگاه کنید، "نابودگر 2".

چرا چشم انداز است - آن را دشوار است؟ از آنجا که تصویر از همان جسم می تواند متفاوت باشد تا حد زیادی بسته به عوامل خارجی است. بسته به نوع جسم از نقاط مشاهده نگاه متفاوت است.

برای مثال، یک و همان شکل، گرفته شده از زوایای مختلف. و آنچه که بیشتر در شکل جالب ممکن است یک چشم، دو چشم و نیم. و بسته به زمینه (اگر این تصویر انسان در یک پیراهن با چشمهای نقاشی)، چشم می تواند بیش از دو.

کامپیوتر هنوز متوجه نباشد، اما "می بیند"

عامل دیگری که را مشکل می سازد - آن نور است. همان صحنه با نور مختلف، متفاوت نگاه خواهد کرد. اندازه شی می تواند متفاوت باشد. علاوه بر این، اشیاء از هر کلاس. چگونه می تواند به شما در مورد یک مرد می گویند که ارتفاع خود را از 2 متر؟ هیچ چیز. رشد انسانی است و ممکن است 2.3 متر و 80 سانتی متر است. همانطور که با انواع دیگری از اشیاء، با این حال، اشیاء از همان کلاس هستند.

به خصوص اشیاء زندگی تحت انواع گونه. مو مردم، ورزشکاران، حیوانات. در تصاویر از اسب های در حال اجرا نگاه کنید، چه با یال خود اتفاق می افتد و دم است که به سادگی غیر ممکن است. اشیاء با هم تداخل دارند در یک تصویر؟ اگر شما پرتاب یک تصویر کامپیوتری، حتی دستگاه قدرتمند ترین پیدا کردن اشکال به تصمیم درست است.

نمایش بعدی - این یک لباس مبدل است. برخی از اشیاء، حیوانات تغییر ظاهر به عنوان محیط زیست، و با مهارت. و لکه های رنگ آمیزی و همان. با این وجود، ما آنها را ببینید، اگر چه نه همیشه از دور.

مشکل دیگر - جنبش است. اشیاء در حال حرکت غیر قابل تصور تحت تغییر شکل.

بسیاری از اشیاء بسیار متغیر هستند. در اینجا، برای مثال، در دو عکس زیر اشیاء از "صندلی".

و در این شما می توانید نشستن. اما برای تدریس به یک ماشین، به طوری که از چیزهای مختلف در شکل، رنگ، مواد، هر چیزی یک شی "صندلی" است - بسیار دشوار است. این چالش است. به ادغام روش از بینایی کامپیوتر - است که برای تدریس یک ماشین به درک، تجزیه و تحلیل، حدس و گمان.

ادغام از بینایی کامپیوتر در سیستم عامل های مختلف

جرم بینایی کامپیوتر شروع به نفوذ بیشتر در سال 2001، زمانی که او ایجاد اولین آشکارساز صورت. ویولا، جونز: ما آن دو نویسنده ساخته شده است. این اولین سریع و قابل اعتماد الگوریتم به اندازه کافی، که قدرت از روش های یادگیری ماشین نشان داده بود.

حالا بینایی کامپیوتر به اندازه کافی برنامه های عملی جدید - به رسمیت شناختن از چهره انسان.

اما به رسمیت شناختن مرد در فیلم - در زوایای تصادفی، شرایط نوری مختلف - غیر ممکن است. اما برای حل این مشکل، و یا یکی که افراد مختلف را با نور های مختلف و یا در یک ژست های مختلف، مشابه به عنوان در عکس در گذرنامه، این امکان را با درجه بالایی از اعتماد به نفس است.

مورد نیاز گذرنامه عکس تا حد زیادی به یکی از ویژگی های الگوریتم های تشخیص چهره به علت.

برای مثال، اگر شما یک گذرنامه های بیومتریک، در برخی از فرودگاه های مدرن، شما می توانید سیستم کنترل پاسپورت به صورت خودکار استفاده کنید.

مشکل حل نشده از بینایی کامپیوتر - توانایی تشخیص هر متن

شاید کسی سیستم OCR استفاده می شود. یکی از این - یک خواننده زیبا، بسیار محبوب در سیستم RuNet است. فرم های بسیاری که در آن شما را در اطلاعات پر کنید، آنها کاملا اسکن، اطلاعات توسط سیستم شناخته بسیار خوبی وجود دارد. اما با هر متن در تصویر وضعیت بسیار بدتر است. این مشکل هنوز حل نشده باقی مانده است.

بازی های مربوط به بینایی کامپیوتر، ضبط حرکت

منطقه بزرگ جدا - ایجاد مدل های سه بعدی و ضبط حرکت (که کاملا با موفقیت در بازی های رایانه ای اجرا) است. اولین برنامه، که با استفاده از بینایی کامپیوتر - یک سیستم تعامل با کامپیوتر با استفاده از حرکات. هنگامی که آن را ساخته شد آن بسیاری از مسائل باز بود.

الگوریتم طراحی شده است کاملا به سادگی، اما به پیکربندی آن را در زمان برای ایجاد یک ژنراتور از تصاویر مصنوعی از مردم برای به دست آوردن یک میلیون تصویر. ابر رایانه با آنها را انتخاب کنید پارامترهای الگوریتم، که او اکنون به خوبی کار می کند.

که یک میلیون تصاویر و هفته زمان ابر رایانه قابل شمارش ممکن است به ایجاد یک الگوریتم است که مصرف 12 درصد از ظرفیت یک پردازنده و اجازه می دهد تا یک فرد برای درک موقعیت در زمان واقعی است. این سیستم های مایکروسافت کینکت (2010).

جستجو برای تصاویر با محتوای شما اجازه می دهد برای آپلود عکس به سیستم، و نتایج حاصل از آن را به تمام تصاویر با همان محتوا می دهد و ساخته شده از همان زاویه ای.

نمونه هایی از بینایی کامپیوتر: سه بعدی و نقشه های دو بعدی در حال حاضر با آن ساخته شده است. نقشه برای اتومبیل ناوبری به طور منظم با توجه به DVR به روز شد.

یک پایگاه داده با میلیاردها عکس ها برچسب جغرافیایی وجود دارد. با دانلود تصویر در پایگاه داده، شما می توانید تعیین که در آن ساخته شده بود و حتی با برخی از دیدگاه. البته، به شرطی که محل به اندازه کافی که محبوب در یک زمان به گردشگران است و ساخته شده و تعدادی از عکس ها از منطقه وجود داشته است.

ربات ها همه جا هستند

رباتیک در حال حاضر، در همه جا، بدون آن به هیچ وجه. در حال حاضر خودروهای دارای دوربین ویژه ای است که عبور و مرور و علائم جاده تشخیص برای انتقال دستورات به راننده (در این راه یک برنامه کامپیوتری برای مشاهده، کمک می کند تا رانندگان) وجود دارد. و یک وسایل نقلیه رباتیک به طور کامل خودکار وجود دارد، اما آنها نمی توانند صرفا بر سیستم دوربین فیلمبرداری بدون استفاده از مقدار زیادی از اطلاعات اضافی تکیه می کنند.

دوربین های مدرن - این یک تاریک آنالوگ است

اجازه دهید در مورد تصویر دیجیتال صحبت کنید. دوربین های دیجیتال مدرن در اصل تاریک مرتب شده اند. فقط به جای سوراخ که از طریق آن نور وارد پرتو و بینی بر روی دیوار پشت اتاق مدار موضوع، ما باید یک سیستم نوری خاص به نام لنز. شی آن این است که جمع آوری یک پرتو نور بزرگ و تبدیل آن به طوری که تمام اشعه از طریق یک نقطه مجازی به منظور به دست آوردن طرح ریزی و به شکل تصویر در فیلم و یا ماتریس منتقل می شود.

دوربین های دیجیتال مدرن (ماتریس) از عناصر منحصر به فرد تشکیل شده است - پیکسل. هر پیکسل می تواند انرژی نور است که حادثه در کل پیکسل اندازه گیری و صدور یک عدد خروجی. بنابراین، در یک دوربین دیجیتال، ما به جای روشنایی تصویر اندازه گیری مجموعه ای نور، گرفتار در یک پیکسل را دریافت کنید - کامپیوتر میدان دید. بنابراین، هنگامی که تصویر ما می بینیم خطوط و خطوط روشن، و یک شبکه از مربع های رنگی در رنگ های مختلف جریان نیست - پیکسل.

در زیر شما اولین تصویر دیجیتال در جهان را ببینید.

اما در این تصویر است، نه؟ رنگ. رنگ چیست؟

ادراک روانشناسی رنگ

رنگ - این چیزی است که ما می بینیم. رنگ یکی و همان چیزی که برای انسان و گربه متفاوت خواهد بود. از آنجا که ما (انسان) و سیستم های نوری حیوانات - چشم انداز متفاوت است. بنابراین، رنگ - از آن کیفیت روانی دید ما رخ می دهد که هنگام مشاهده اشیاء و نور است. و نه یک خاصیت فیزیکی از جسم و نور است. رنگ - نتیجه تعامل اجزاء نور، و صحنه سیستم بینایی ما است.

برنامه نویسی کامپیوتر چشم انداز در پایتون استفاده از کتابخانه

اگر شما تصمیم به تعامل جدی در این مطالعه از بینایی کامپیوتر، باید فورا برای تعدادی از مشکلات آماده سازی، این علم است که ساده ترین نیست و پنهان تعدادی از مشکلات. اما "برنامه نویسی کامپیوتر چشم انداز در پایتون" تالیف و تصنیف از جان اریک Solema - یک کتاب است که همه به یک زبان ساده ترین را تشریح میکند. در اینجا شما را با روش های شناخت اشیاء مختلف در 3D آشنا، یادگیری کار با تصویر استریو، واقعیت مجازی و بسیاری از برنامه های کاربردی دیگر از بینایی کامپیوتر. در این کتاب نمونه به اندازه کافی در پایتون می باشد. اما توضیحات ارائه شده، پس به صحبت می کنند، تعمیم، به عنوان اضافه بار بیش از حد تحقیقات و داده سخت نیست. کار مناسب برای دانش آموزان، آماتور، و علاقه مندان. دانلود این کتاب و دیگران در مورد بینایی کامپیوتر (پی دی اف فرمت) می تواند در شبکه می باشد.

در حال حاضر، می کتابخانه متن باز از الگوریتم های بینایی کامپیوتر و پردازش تصویر و الگوریتم های عددی اوپنسیوی وجود دارد. این است که در بسیاری از زبان های برنامه نویسی مدرن اجرا، منبع باز است. اگر ما در مورد بینایی کامپیوتر صحبت می کنید، با استفاده از پایتون به عنوان یک زبان برنامه نویسی، آن را نیز تا به حمایت از کتابخانه، علاوه بر این، آن است که همواره در حال تحول است یک جامعه بزرگ و.

شرکت "مایکروسافت" خدمات خود را API-قادر به آموزش شبکه عصبی به آن کار با تصاویر از مردم فراهم می کند. همچنین این فرصت به درخواست بینایی کامپیوتر وجود دارد، استفاده می کند پایتون به عنوان یک زبان برنامه نویسی.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 fa.delachieve.com. Theme powered by WordPress.