به گزارش افکارنیوز به نقل از خبرآنلاین ، این شرکت تاکنون ۲ میلیون دلار خرج کرده تا بتواند کهنهکارهای عرصه فناوری نظیر جوی ایتو، رییس لابراتوار مدیای MIT، الد گیل، معاون رییس راهبردی توییتر و اندی بچتولشیم، بنیانگذار سان میکروسیستمز را گرد هم آورد. نرمافزاری که Diffbot طراحی کرده از فناوری آموزش دیداری که معمولا توسط خودروهای بدون راننده مورد استفاده قرار میگیرد، بهره میبرد تا از این طریق، عناصر مختلف روی صفحه را شناسایی و محتوای آنها را خلاصه کند. سپس برچسبهایی را برای محتواها ایجاد کرده و به طور خودکار عناوین مشابه را در یک گروه دستهبندی کند.

این شرکت ادعا می‌کند که هر صفحه وب در یکی از ۱۸ گروه اصلی نظیر پروفایل شبکه اجتماعی، مرور و بررسی، صفحه اصلی یا صفحه محصولات جا می‌گیرد و هر کدام از این صفحات دستور زبان دیداری خاص خود را دارد. این ایده که Diffbot در نهایت می‌تواند هر آدرس اینترنتی یا URL را بگیرد و براساس محتوا، آن را در یکی از ۱۸ گروه اصلی رده‌بندی کند، چندان دور از ذهن نیست و در آینده‌ای نزدیک محقق خواهد شد.

در واقع، این برنامه در ابتدا وع صفحه را تعیین می‌کند و بعد عناصر مختلف یعنی تصاویر، عکس‌ها، سرصفحه‌ها، نویسنده‌ها، موسیقی یا تبلیغات آن را تفکیک می‌کند. این برنامه از پردازش زبان طبیعی برای درک محتوا استفاده می‌کند و درمی‌یابد که محتوای محوری آن چیست. سپس با استفاده از ویکی‌پدیا، بزرگ‌ترین دایره‌المعارف زنده دنیا برچسب‌های محتوایی روی مطالب و عناوین آن ایجاد می‌کند. این برنامه می‌تواند برای بازنگری محتوای پلات‌فورم‌های مختلف مورد استفاده قرار گیرد.

به طور مثال، از طریق این برنامه میتوان محتوای خاص را از یک صفحه وب به یک اپلیکیشن آیپد منتقل کرد. مایک تانگ، مدیر اجرایی Diffbot زمانی که از دانشگاه استانفورد و از رشته برنامهنویسی هوش مصنوعی فارغالتحصیل شد، این شرکت را تاسیس کرد. این شرکت تابستان سال گذشته، یک سری رابطهای برنامه کاربردی طراحی کرد و از آن زمان به بعد ماهانه حدود ۱۰۰ میلیون فراخوان IPI مواجه شده که از سوی شرکتهایی که به دنبال سازماندهی محتوای وب درخواست میشوند.