گوگل و فناوری باورنکردنی تازه ارتقای کیفیت عکس ها: یک عکس 64 در 64 پیکسل بدهید و عکس 1024 در 1024 تحویل بگیرید
به گزارش وبلاگ صبوحا، وقتی فیلم ها و سریال ها را دیدن می کنیم، بارها پیش آمده که از صحنه های خاصی حرص خورده باشیم. یکی از این صحنه های تکراری این است که یک عکس یا ویدئوی محو و کم کیفیت خاص را ماموران پلیس یا امنیتی می توانند، آنقدر عظیم و باکیفیت نمایند که جزئیاتش هم تعیین گردد. درست است که با پردازش کامپیوتری می توان مقداری به وضوح عکس ها اضافه کرد، اما اینها در حد معجزه هم نیستند و به صورت خلاصه نمی توان دیتایی ثبت نشده را خلق کرد. فقط می گردد که حدس زد که دیتای پیکسل های دیگر چه می توانسته اند باشند و وقتی آنها به تصویر اضافه شدند، چشم ما می تواند جزئیات اضافه ببیند. اما آیا واقعا چنین نرم افزارهای افزایش کیفیتی وجود دارند. باید بگوییم که محصولات متعددی در این زمینه وجود دارند و گوگل هم به تازگی نتایج کوشش چندساله اش را منتشر نموده.
تصور کنید که عکس های کم کیفیت تاریخی دارید یا تصور بفرمایید و یا بعضی شخصیت های مهم تاریخ را در نظر آورید که از آنها فقط چند عکس به جا مانده، در این صورت فناوری های افزایش وضوح و ابعاد عکس ها می توانند کاربردی شوند و خدمت زیادی به ما نمایند.
به تازگی در وبلاگ هوش مصنوعی گوگل، مقاله جالبی منتشر نشده که نشان می دهد تیم پژوهشی گوگل موسوم به Brain Team چقدر در این زمینه فعال است.
این تیم یک مدل یادگیری هوش مصنوعی ایجاد نموده و تعلیم داده که می تواند عکس ها کم کیفیت را تبدیل به عکس های پرکیفیت کند. کانسپت این کار را گوگل مدل های پخش یا diffusion models می نامد. نخستین بار در سال 2015 گوگل خبر داده بود که روی چنین چیزی کار می نماید و حالا برای نخستین بار عکس هایی از نخستین محصول نهایی شده منتشر نموده که SR3 نامیده می گردد.
SR3 می تواند نویز عکس ها را بگیرد. شیوه کار الگوریتم یادگیری ماشینی است که ابتدا به صورت معکوس آموزش داده می گردد. یعنی عکس های پرکیفیت به این الگوریتم نشان داده می گردد و بعد در فرایندی نویز به عکس ها اضافه می گردد. الگوریتم این دو عکس را با هم مقایسه می نماید. بعد یاد می گیرد در روندی معکوس عمل کند.
فعلا SR3 آنقدر خوب عمل می نماید که می تواند تصویر چهره ها را 8 برابر عظیم تر کند. محصول بعدی این فرایند CDM نامیده خواهد شد.
گوگل عکس هایی زیادی منتشر نموده که نشان می دهد الگوریتمش چطور عکس های 32 د 32 را به عکس های 64 در 64 و سپس 256 در 256 و حتی 1024 در 1026 تبدیل نموده است.
چنین فناوری ای می تواند کاربردهای متعدد پیدا کند که یکی از آنها افزایش کیفیت تصویربرداری های پزشکی است.
منبع: یک پزشک