بینایی رایانه توسط OpenCv با پایتون

بینایی رایانه توسط OpenCv با پایتون

قیمت : ۲۷۰,۰۰۰ ریال
این کتاب نحوه استفاده از انقیادهای پایتون OpenCV را برای ضبط ویدئو، دست کاری تصاویر و ردیابی اشیاء با یک وب کم معمولی یا یک حسگر عمق تخصصی مانند مایکروسافت کینکت (Microsoft Kinect ) به شما نشان می دهد. OpenCV یک کتابخانه متن باز و چند پلت فرمی است که بلوک های اساسی برای آزمایش و برنامه های بینایی رایانه فراهم می کند. این رابطه ی سطح بالایی را برای ضبط، پردازش و ارائه داده های تصویر فراهم می کند. به عنوان مثال، جزئیات مربوط به سخت افزار دوربین و تخصیص آرایه را توضیح می دهد. OpenCV به طور گسترده ای در دانشگاه و صنعت مورداستفاده قرار می گیرد.
امروزه بینایی رایانه ای میتواند در بسیاری از زمینه ها از طریق وب کم، تلفن های دوربین دار و حسگرهای بازی مانند کینکت به دست مصرف کنندگان برسد. چه خوب و چه بد، مردم دوست دارند جلوی دوربین باشند و به عنوان توسعه دهندگان، ما با تقاضا برای برنامه هایی روبه رو هستیم که تصاویر را ضبط می کنند، ظاهر آن ها را تغییر می دهند و اطلاعات را از آن ها استخراج می کنند. پیوندهای پایتون OpenCV می تواند به ما کمک کند راه حل های این الزامات را در یک زبان سطح بالا و در قالب داده استاندارد شده که با کتابخانه های علمی مانند NumPy و SciPy قابل همکاری است، کشف کنیم.
اگرچه OpenCV سطح بالا و مفسری است، اما لزوما برای کاربران جدید آسان نیست. بسته به نیازهای شما، گستردگی OpenCV ممکن است به قیمت یک فرآیند راه اندازی پیچیده و عدم اطمینان در مورد نحوه تبدیل عملکردهای موجود به کد برنامه ریزی شده و بهینه برنامه باشد. برای کمک به شما در این مشکلات، من سعی کرده ام یک کتاب مختصر با تاکید بر تنظیمات سر راست، طراحی برنامه های سرراست و درک ساده از هدف هر تابع ارائه دهم.
به طور خاص، در پایان فصل اول این کتاب، میتوانید یک محیط توسعه داشته باشید که به Python، OpenCV، کتابخانه های دوربین تشخیص عمق و کتابخانه های علمی عمومی دسترسی دارد. پس از پنج فصل، می توانید چندین برنامه کاربردی سرگرم کننده را انتخاب کنید که صورت کاربران را در فید دوربین زنده دست کاری می کند. در پشت این برنامه، شما یک کتابخانه کوچک از توابع و کلاس های قابل استفاده مجدد خواهید داشت که می توانید در پروژه‌های بینایی کامپیوتری خود در آینده استفاده کنید. اجازه دهید کتاب را با جزئیات بیشتری بررسی کنیم.
این کتاب شامل چه مواردی است
فصل 1: راه‌اندازی OpenCV، این امکان را می‌دهد که مراحل راه‌اندازی Python، OpenCV و کتابخانه‌های مرتبط در ویندوز مک و اوبونتو بررسی شود. همچنین این فصل دربارهٔ جامعه OpenCV، اسناد و مثال‌های کد رسمی بحث می‌کند.

فصل 2: مدیریت فایل‌ها، دوربین‌ها و رابط کاربری گرافیکی، کمک می‌کند تا بتوان دربارهٔ توابع ورودی/خروجی OpenCV بحث کرد. سپس، با استفاده از طراحی شیء‌گرا، برنامه‌ای نوشته می‌شود که که فید دوربین زنده را نمایش می‌دهد، ورودی صفحه کلید را کنترل می‌کند و فایل‌های ویدئویی و تصویری ثابت می‌نویسد.

فصل 3: فیلتر‌کردن تصاویر، کمک می‌کند تا فیلترهای تصویر با استفاده از OpenCV، NumPy و SciPy نوشته شود. جلوه‌های فیلتر شامل دست‌کاری رنگ خطی، دست‌کاری رنگ منحنی، تاری، تیز و برجسته لبه‌ها است. برنامه تغییر می‌کند تا برخی از این فیلترها در فید دوربین زنده اعمال شود.

فصل 4: ردیابی چهره‌ها با آبشار هار (Haar)، این امکان را می‌دهد که یک ردیاب چهرهٔ سلسله‌مراتبی نوشته شود که از OpenCV برای تعیین چهره، چشم‌ها، بینی و دهان در یک تصویر استفاده می‌کند. همچنین توابعی را برای کپی و تغییر اندازهٔ مناطق تصویر می‌توان نوشت. برنامه به‌گونه‌ای اصلاح می‌شود که چهره‌ها را در فید دوربین پیداکرده و دست‌کاری کند.

فصل 5: تشخیص مناطق پیش‌زمینه/پس‌زمینه و عمق کمک می‌کند تا بتوان با انواع داده‌هایی که OpenCV می‌تواند از دوربین‌های تشخیص عمق (با پشتیبانی OpenNI و SensorKinect) ضبط کند، آشنا شد. سپس، توابعی نوشته می‌شود که از چنین داده‌هایی برای محدود‌کردن یک افکت به یک منطقهٔ پیش‌زمینه استفاده می‌کنند. این قابلیت در برنامه گنجانده‌‌شده تا بتوان مناطق صورت را قبل از دست‌کاری بیشتر اصلاح کرد.

ضمیمه A: ادغام با Pygame، این امکان را می‌دهد که بتوان برنامه را تغییر داد تا از Pygame به‌جای OpenCV برای مدیریت برخی رویدادهای ورودی/خروجی خاص استفاده شود. (Pygame توابع متنوع‌تری برای مدیریت رویداد ارائه می‌دهد.)

ضمیمه B: ایجاد آبشار هار (Haar) برای اهداف سفارشی، این امکان را می‌دهد که مجموعه‌ای از ابزارهای OpenCV بررسی شود که برای هر نوع شی یا الگو، نه لزوما چهره، می‌تواند ردیاب بسازد.
مرتبط با این کتاب

نظرات کاربران
هنوز نظری برای این کتاب ثبت نشده است.