بینایی رایانه توسط OpenCv با پایتون
قیمت : ۲۷۰,۰۰۰ ریال
این کتاب نحوه استفاده از انقیادهای پایتون OpenCV را برای ضبط ویدئو، دست کاری تصاویر و ردیابی اشیاء با یک وب کم معمولی یا یک حسگر عمق تخصصی مانند مایکروسافت کینکت (Microsoft Kinect ) به شما نشان می دهد. OpenCV یک کتابخانه متن باز و چند پلت فرمی است که بلوک های اساسی برای آزمایش و برنامه های بینایی رایانه فراهم می کند. این رابطه ی سطح بالایی را برای ضبط، پردازش و ارائه داده های تصویر فراهم می کند. به عنوان مثال، جزئیات مربوط به سخت افزار دوربین و تخصیص آرایه را توضیح می دهد. OpenCV به طور گسترده ای در دانشگاه و صنعت مورداستفاده قرار می گیرد.
امروزه بینایی رایانه ای میتواند در بسیاری از زمینه ها از طریق وب کم، تلفن های دوربین دار و حسگرهای بازی مانند کینکت به دست مصرف کنندگان برسد. چه خوب و چه بد، مردم دوست دارند جلوی دوربین باشند و به عنوان توسعه دهندگان، ما با تقاضا برای برنامه هایی روبه رو هستیم که تصاویر را ضبط می کنند، ظاهر آن ها را تغییر می دهند و اطلاعات را از آن ها استخراج می کنند. پیوندهای پایتون OpenCV می تواند به ما کمک کند راه حل های این الزامات را در یک زبان سطح بالا و در قالب داده استاندارد شده که با کتابخانه های علمی مانند NumPy و SciPy قابل همکاری است، کشف کنیم.
اگرچه OpenCV سطح بالا و مفسری است، اما لزوما برای کاربران جدید آسان نیست. بسته به نیازهای شما، گستردگی OpenCV ممکن است به قیمت یک فرآیند راه اندازی پیچیده و عدم اطمینان در مورد نحوه تبدیل عملکردهای موجود به کد برنامه ریزی شده و بهینه برنامه باشد. برای کمک به شما در این مشکلات، من سعی کرده ام یک کتاب مختصر با تاکید بر تنظیمات سر راست، طراحی برنامه های سرراست و درک ساده از هدف هر تابع ارائه دهم.
به طور خاص، در پایان فصل اول این کتاب، میتوانید یک محیط توسعه داشته باشید که به Python، OpenCV، کتابخانه های دوربین تشخیص عمق و کتابخانه های علمی عمومی دسترسی دارد. پس از پنج فصل، می توانید چندین برنامه کاربردی سرگرم کننده را انتخاب کنید که صورت کاربران را در فید دوربین زنده دست کاری می کند. در پشت این برنامه، شما یک کتابخانه کوچک از توابع و کلاس های قابل استفاده مجدد خواهید داشت که می توانید در پروژههای بینایی کامپیوتری خود در آینده استفاده کنید. اجازه دهید کتاب را با جزئیات بیشتری بررسی کنیم.
این کتاب شامل چه مواردی است
فصل 1: راهاندازی OpenCV، این امکان را میدهد که مراحل راهاندازی Python، OpenCV و کتابخانههای مرتبط در ویندوز مک و اوبونتو بررسی شود. همچنین این فصل دربارهٔ جامعه OpenCV، اسناد و مثالهای کد رسمی بحث میکند.
فصل 2: مدیریت فایلها، دوربینها و رابط کاربری گرافیکی، کمک میکند تا بتوان دربارهٔ توابع ورودی/خروجی OpenCV بحث کرد. سپس، با استفاده از طراحی شیءگرا، برنامهای نوشته میشود که که فید دوربین زنده را نمایش میدهد، ورودی صفحه کلید را کنترل میکند و فایلهای ویدئویی و تصویری ثابت مینویسد.
فصل 3: فیلترکردن تصاویر، کمک میکند تا فیلترهای تصویر با استفاده از OpenCV، NumPy و SciPy نوشته شود. جلوههای فیلتر شامل دستکاری رنگ خطی، دستکاری رنگ منحنی، تاری، تیز و برجسته لبهها است. برنامه تغییر میکند تا برخی از این فیلترها در فید دوربین زنده اعمال شود.
فصل 4: ردیابی چهرهها با آبشار هار (Haar)، این امکان را میدهد که یک ردیاب چهرهٔ سلسلهمراتبی نوشته شود که از OpenCV برای تعیین چهره، چشمها، بینی و دهان در یک تصویر استفاده میکند. همچنین توابعی را برای کپی و تغییر اندازهٔ مناطق تصویر میتوان نوشت. برنامه بهگونهای اصلاح میشود که چهرهها را در فید دوربین پیداکرده و دستکاری کند.
فصل 5: تشخیص مناطق پیشزمینه/پسزمینه و عمق کمک میکند تا بتوان با انواع دادههایی که OpenCV میتواند از دوربینهای تشخیص عمق (با پشتیبانی OpenNI و SensorKinect) ضبط کند، آشنا شد. سپس، توابعی نوشته میشود که از چنین دادههایی برای محدودکردن یک افکت به یک منطقهٔ پیشزمینه استفاده میکنند. این قابلیت در برنامه گنجاندهشده تا بتوان مناطق صورت را قبل از دستکاری بیشتر اصلاح کرد.
ضمیمه A: ادغام با Pygame، این امکان را میدهد که بتوان برنامه را تغییر داد تا از Pygame بهجای OpenCV برای مدیریت برخی رویدادهای ورودی/خروجی خاص استفاده شود. (Pygame توابع متنوعتری برای مدیریت رویداد ارائه میدهد.)
ضمیمه B: ایجاد آبشار هار (Haar) برای اهداف سفارشی، این امکان را میدهد که مجموعهای از ابزارهای OpenCV بررسی شود که برای هر نوع شی یا الگو، نه لزوما چهره، میتواند ردیاب بسازد.
مرتبط با این کتاب
نظرات کاربران