تقوم منظمة العفو الدولية بتقييم المواقع عن طريق تقليد أشخاص حقيقيين وحتى تفوقهم. كيف يتم ذلك؟

اليوم ، أصبح أحد مكونات نظام uKit AI ، وهو نظام ذكي لإعادة تصميم مواقع الويب ، متاحًا للجميع. إنها وحدة نموذجية أولية لتقييم جمال صفحات الويب. فهو يجمع بين شبكة عصبية وأشجار قرار لتقليد رد فعل الزائر العادي لتصميم موقع الويب.

في المستقبل ، ستقوم هذه الوحدة بتقييم عمل خوارزمية التصميم التوليدي ، العنصر الرئيسي في uKit AI ، والتي ستصمم الصفحات دون تدخل بشري اعتمادًا على المحتوى المتاح و "معرفة" الفرق بين موقع الويب غير الفعال و واحد يهدف إلى زيادة معدل التحويل.

يعكس الإصدار الحالي من WebScore AI وجهة نظر مستخدم الإنترنت العادي حول مظهر موقع الويب. على الرغم من أنه يمكننا إنشاء خيارات أخرى ، على سبيل المثال ، من الممكن تقييم قابلية استخدام موقع الويب.

المواقع المستخدمة لتدريب النظام. بادئ ذي بدء ، لقد جمعنا 12000 موقعًا ومتجرًا عبر الإنترنت تم إنشاؤها في سنوات مختلفة على منصات مختلفة ولغات مختلفة. كانت المهمة الرئيسية هي الحصول على ما يكفي من أمثلة التدرجات المرئية ، من المواقع الإلكترونية السيئة إلى تلك الجيدة جدًا. بهذه الطريقة ، أظهرنا للنظام ما يمكن أن يحدث عبر الويب الحديث.

زوجان من المواقع من عينة التدريب.

يقاس كل تدرج بمقياس ، ومن المفترض أن يفهم هذا المقياس من قبل شخص عادي نحاول برأيه نمذجة. لذلك ، توصلنا إلى فكرة عن مقياس "من 1 إلى 10" ، والذي يستخدم في خدمتنا.

الأشخاص الذين يتم تقليدهم بواسطة WebScore AI. كنا بحاجة إلى شيئين لتشكيل مجموعة بيانات (مجموعة من البيانات لنموذج التدريب) من مجموعة متنوعة من المواقع الإلكترونية:

  • العلامات التي يحدد بها النظام ما إذا كان موقع الويب جذابًا ؛
  • يقيم (علامات) مصنوعة بمساعدة مقياسنا لعدد معين من المواقع. سوف تصبح نموذجا للنظام.

شخص ما يجب أن يضع هذه التقييمات الأولية. إن مثل هذا "المعلم" ، أو مجموعة من "المعلمين" ، لتكون أكثر تحديدًا ، ستؤثر بشكل كبير على كيفية عمل النموذج.

واجهة تقييم المواقع الإلكترونية: خذ واستخدمها من GitHub قريبًا.

لجمع مجموعة تركيز ، أجرينا اختيارًا مبدئيًا للمرشحين على 1500 مثال لموقع إلكتروني. عمل روتيني ، ولكن مسؤول واحد و requring تركيز كبير. ساعدنا الاختيار المبدئي في التخلص من المرشحين غير المناسبين وكذلك لاستبعاد المواقع "المثيرة للجدل" (عندما يصنفها شخص ما على أنه واحد والآخر 10) من العينة.

في البداية ، جربنا طرق التقييم.

على سبيل المثال ، عرضنا تقييم موقع ويب واحد في وقت واحد ، ثم موقعين في نفس الوقت ، أو اختيار موقع واحد من موقعين ، الأكثر جاذبية. الطريقة التي رأى بها المستفتى موقعًا واحدًا على الويب وقيمها كانت تعمل بشكل أفضل. استخدمناها لتقييم 10.000 من المواقع المتبقية.

تقييم شخص ما إذا كان موقع الويب جميلًا أم لا. كيف سوف تفعل هذا الجهاز؟ أنت وأنا بحاجة إلى نظرة واحدة فقط لتشكيل رأي حول الجمال العام لشيء ما. لكننا نعرف أن الشيطان موجود في التفاصيل.

تعد علامات جاذبية الموقع المرئية التي ستوجه النموذج بمثابة لحظة مهمة للمشروع بأكمله. لقد طلبنا فريق تصميم منشئ موقع uKit من جهة ، ويستخدم عملهم كأساس لمئات الآلاف من مواقع الويب ، ويراها ملايين الأشخاص. لقد جمعنا معًا قائمة موسعة من الميزات التي يهتم بها المحترفون عند تطوير تصميم موقع الويب. وحاول بعد ذلك قطعها ، ولم يتبق سوى أهمها.

فريق تصميم uKit.com.

نتيجةً لذلك ، حصلنا على قائمة تحقق من 125 معيارًا مختلفًا تمامًا ولكنه مهم تم تجميعه في 15 فئة. على سبيل المثال ، تحتوي القائمة على: التكيف مع الشاشات الشائعة ، ومجموعة متنوعة من أحجام الخطوط ، ونقاء الألوان ، وطول العناوين ، ونسبة الصور في الصفحة بأكملها ، وما إلى ذلك. ما تبقى هو تدريب النموذج باستخدام هذه القواعد.

إنشاء خوارزمية. ما هو "نموذج التدريس" بالضبط؟ إنه بناء خوارزمية تستند إلى مجموعة معينة من الخصائص ويمكنها تقييم الموقع المحدد. من المرغوب فيه أن يشترك تقييم النظام وتقييم المعلم المتوسط ​​في الحد الأدنى من الفجوة في تقييماتهم النهائية.

لقد قررنا استخدام طريقة التدرج اللوني على أشجار القرار ، لأنها واحدة من أكثر الطرق شعبية وفعالية. باستخدام الخوارزميات الأساسية ، فإنه ينشئ مجموعة ، والنتيجة الإجمالية التي تتجاوز نتائج أي خوارزمية منفصلة.

علاوة على ذلك ، بإضافة كل خوارزمية أساسية لاحقة ، تحاول تحسين جودة إجابات المجموعة بأكملها.

لتسريع وتخفيف هذه العملية ، استخدمنا مكتبة CatBoost من Yandex التي تسمح ببناء معزز قائم على التدرج فيما يسمى "أشجار القرار النسيان" لضمان إمكانات التدريب الجيدة لنموذج من البداية والانتقال السريع إلى توفير التنبؤات (تقديرات ) لكائنات جديدة.

إضافة شبكة العصبية. عندما كانت الخوارزمية الأساسية جاهزة ، قررنا إجراء تجربة: هل ستتحسن النتائج إذا أضفنا شبكة عصبية؟ في الواقع ، لقد عرفنا بالفعل كيفية "النظر" إلى موقع الويب وتصميمه ، والآن قررنا إعطاء النظام نوعًا من "العدسة المكبرة" التي يمكنه استخدامها للكشف عن مزيد من التفاصيل.

اخترنا واحدة من أكثر الشبكات شعبية ، resnet50 ، والمعروفة باسم خوارزمية جيدة لاستخراج ميزات عالية المستوى. لقد تعلمنا كيفية الحصول على 1000 سمة إضافية لتقييم موقع الويب. ونتيجة لذلك ، يميز النظام الآن عنوان URL بما مجموعه 1125 ميزة ويجد "موقع" موقع الويب على مقياس من 10 نقاط. تستغرق العملية ما يصل إلى عدة عشرات من الثواني ، ولهذا فإننا نعتبر تسريع النموذج من خلال تقليل عدد العلامات مع الحفاظ على جودة التقييم على نفس المستوى.

النتائج الأولى. يمكن أن يقدم النموذج المدرب بهذه الطريقة تقديرات أكثر دقة بمقدار ثلاثة أضعاف مقارنة بتقديرات "المعلمين" الفردية.

يمكننا أن نقول إن هذا النموذج تجاوز المعلمين الأوائل لأن تقديرات مجموعة التركيز تختلف عن المتوسط ​​أكثر بكثير من تقدير الشبكة العصبية. الآن نضع الخوارزمية في الشبكة لمزيد من التدريب. ويمكنك أن تصبح معلمها كذلك.