| Последние новости из мира SEO
0 новых постов за сегодня

КАК Я ДЕЛАЛ КИНОСАЙТ

+3

17 июня 2016 — 19:07

За полтора месяц наконец всё додел, что хотел и запустил 3 киносайта. Но обо всём по порядку.

Использовать готовый движок мне претит по соображениям веры! Я же, хоть и плохенько, но знаю PHP и могу всё написать сам. С нуля! Никаких фреймворков и прочего. Хочешь сделать хорошо — сделай сам. Плохо — тоже сам, но своё есть свой. Своё говно не пахнет. Мне понравилась мысль, что можно сделать узконишевую CMS, в которой ничего лишнего. DLE, конечно, неплохо подходит для создания киносайта. К тому же на форуме есть умельцы, которые за условную тысячу рублей поставят двиг и нужные модули, настроят парсеры и прочие свистелки-перделки. Хороших киношных шаблонов тоже полно в паблике (в привате тем более) и его также могут натянуть, если самому лень разбираться. Останется только заказывать контент и наполнять. Но, как говорил Сеня из «Приключений Шурика»: «Это же не наш метод. Где гуманизм?». Поэтому я принялся обдумывать, как лучше сделать и что хочу.

А хотел я как можно более автоматизированную систему. Наполнять, ковыряться с каждым фильмом и даже сайтом я не горел желанием. Однажды я чуть не разбил ноутбук при добавлении десятка статей на один сайт. С тех пор статейники и вообще подобную рутину стараюсь избегать.

Нужно было сделать онлайн кинотеатр именно таким, каким хотел бы видеть сам и на котором самому можно было смотреть фильмы, порекомендовать бате, наконец. Начал ходить по выдаче, изучать самые разные киносайты. Просмотрел более полтоса и сделал вывод: большинство кинотеатров — неюзабельное говно на задроченных шаблонах, типа Киного.

На основе увиденного начал формировать некий собирательный образ будущего киносайта. Отталкивался я от мысли, что пустой онлайн кинотеатр никому не нужен, поэтому необходима начальная база фильмов из 3-5К, минимум 1000 сериалов/мультсериалов и столько же мультиков. Проблема с копипастом (а для нового сайта он может быть губителен) решается просто: страницы закрываются от индексации и всего делов.

Следующей очевидной проблемой, которую необходимо было решить на этапе проектирования движка, — это чёткое разделение на фильмы, сериалы, мультфильмы, мультсериалы и документальные фильмы/тв. По сути 5 разных разделов со своими особенностями. Аниме я решил включить в состав мультиков просто отдельной категорией. Есть еще ТВ-передачи, но там всё проще и их мало (около 60).

  • Движок
    За основу взял свою же разработку. Т.е. весь каркас есть и некоторые готовые функции. Естественно, пришлось многое дописывать, т.к. требуется специфический функционал.
  • База фильмов
    Для начала нужен был список фильмов, чтобы отобрать из них стоящие киношки. Для этого спарсил фильмы из Фаст-торрент (около 30К фильмов). Проверил частотность и оставил:
    а) те, которые ищут
    б) топ 1 000 фильмов по оценкам.

    У меня получилось 5647 востребованных фильмов.
    Более 5000 фильмов с частотностью, отличной от нуля. Еще где-то 1000 просто нужна, т.к. задействованы в сериях по книгам (чтобы серия была полной) или подборках (про гетто, например).
    Фаст-торрент был выбран потому, что у него огромная база. Есть сортировка по рейтингу, есть id Кинопоиска (это важно), есть кадры из фильмов, теги, ковер, комментарии.

  • Парсер Кинопоиска
    Написал парсер Кинопоиска (который не банится — есть фишка) и спарсил данные по этим фильмам.
  • Шаблон
    Верстальщик из меня, честно говоря, хуевый. Еще хуже, чем кодер. Отредактировать простенький CSS — могу, естественно. HTML-теги знаю. Но с нуля сверстать не смогу, да и никогда не имел тяги к этому. Поэтому пришлось лишь взять и хорошенько переделать адаптивный HTML5-шаблон.
    Также рипал некоторые понравившиеся элементы у других сайтов. В общем, собрал шаблон из говна и палок. На это потратил достаточно много времени, но мне нравится ковыряться, переделывать, этого не отнять. Могу над несущественным элементом зависнуть на целый вечер, а то и два-три. А в итоге вернуться к исходному.
  • Главная
    На главной выводятся только актуальные новинки. Причем только фильмы, к которым уже есть видео. Никакой наёбки, типа заходишь на страницу фильма, а там только трейлер или «видео удалено по требованию правообладателя».
    На том же Киного мне не нравится вывод материалов. А вот на online-life.cc норм, но сделал немного по-другому с помощью JS-скрипта «sliding boxes».
    У многих киносайтов проблема — общая лента из фильмов, серий, сезонов, мультфильмов, телепередач. Причем, если добавили фильм 2012 года, то он также красуется на главной. Я понимаю, как вебмастер, что это новое поступление. Но как пользователю они мне нахуй не нужны. На главную заходят, чтобы посмотреть, что новенького есть. А нам выдают непонятную мешанину. Или бывает еще вот так:
    Но это это хуйня ебаная! Нет?
    Я сделал вывод добавленных фильмов (не новинок) небольшим отдельным блоком в самом низу. Таким образом поисковой робот схавает и пользователям не мешает.
    Естественно разные блоки для фильмов / мультфильмов / сериалов. Кстати, наиболее удачным решением для сериалов я считаю у Сезонвар. Действительно удобно выглядят обновления, поэтому для главной позаимствовал их табличку вывода серий. А в разделе «Сериалы» выводятся только карточка с сериалом, где указан информация о последнем сезоне и серия, а также доступные озвучки. Подобного блядства, как выше на скрине, я избежал.
  • Сериалы и мультсериалы
    Если с фильмами и мультфильмами все достаточно просто, то к сериалам отдельное требование: есть сезоны и серии. Есть разные озвучки.
    Я сделал так, чтобы можно было указать связки «2 сезон = 5 серий». На основе этого автоматически были доступны страницы с сериями. Т.е. нет необходимости вручную создавать для каждого сезона и тем более серии отдельные страницы. При этом можно прописать уникальное описание, либо оставить просто сгенерированный шаблон.
    Для сериала я заказывал много разных небольших описаний (300-500 символов), чтобы можно было вешать на отдельную серию. Когда у сериала появляется новая серия, то скрипт берет из специального файла следующее описание и создаёт страничку. Если описания кончились, то страничка не создается, но доступна к просмотру, в качестве описания берётся дефолтное, сама страница закрывается от индексации мета-тегом «noindex», чтобы не было дублей. А мне на почту приходит уведомление, что надо бы заказать еще описаний.
    В сортировках сделал чекбокс «завершённые». Лично я сам предпочитаю смотреть сериалы, которые уже кончились, а такая фича мало где есть. Удобно!
    Добавил такие категории «Ситкомы», «Дорамы» и «Мини-сериалы».
  • Аниме
    Прошелся по аниме видеосайтам. Сделал вывод — тут заморачиваться с категориями нет смысла. Все эти онанаги, седзи и прочие непонятные слова никто не ищет. Вордстат не врет. А ради 2,5 упоротых онямушников заморачиваться нет смысла. Ну и на форуме увидел подтверждение слов владельца нескольких аниме-порталов: достаточно просто часто обновлять, а все эти поиски-сортировки нах не упали.
  • Передачи
    Тоже целая отдельная ниша, которые многие сильно недооценивают. Передачи смотрят и смотрят хорошо. По телеку не всегда удается посмотреть, а узнать кого обсуждал Малахов или Бузова в этот раз очень уж хочется. Один только «Дом 2» собирает тонны трафа, но и другие передачи тащут неплохо, если судить по количеству просмотров на некоторых киносайтах. Тут чисто новостной эффект — важно выложить видео как можно быстрее после ее показа по ТВ, завтра она уже никому особо не нужна.
    Еще есть документальные фильмы и передачи. Как-то видел на Телдери лот подобной тематики. Сайт чисто под документалкам, а свои 9К трафа в сутки имеет. Причем траф постоянный и от новинок не зависит.
  • Жанры
    Для меня было неприятной новостью, что Кинопоиск довольно ограничен. Нет жанров «Любовь», «Мистика», «Сказки», зато есть бесполезные «детские» и «для взрослых». В сериалах нет «Ситком», «Дорамы». Нет тегов. Есть ключевые слова, которые бесполезны. Пришлось писать парсеры. Тут помогли фаст-торрент и кинокопилка.
  • Комбинации
    Как-то с целью подрочить зашел на sozrel.xxx и увидел такую фишку, как комбинации. Т.е. возможность выводить пересечения сразу нескольких жанров, стран. Например «фантастические боевики» или «русские мелодрамы про любовь». Если посмотреть вордстат, то такое востребовано.
  • Теги
    Составил 242 тега. Протегировал 100 фильмов сам — рутина та еще. Пробовал заказать на eTXT. В итоге протегировали еще 200 фильмов и все, никто не берется особо. Тут вариант — заказывать описания и требовать проставить теги. В этом случае рерайтеру будет куда легче, потому что он пишет описание и представляет о чем фильм. Пока в процессе поиска исполнителя.
  • Все части
    Подсмотрел в статистике одного киносайта, что весь траф (около 5К в сутки) идёт чисто на подборки с частями фильмов (Гарри Поттер все части; все фильмы про Бэтмена и т.д.). Искать и тегировать вручную или создавать отдельную страницу (как делают в основном) — проще убиться. На помощь снова приходит знание пэхапэ. Большинство частей выглядит следующим образом: «Властелин Колец: Две крепости» или «Решала 2». Поэтому здесь довольно просто автоматизировать: регуляркой берём основу до цифры или до двоеточия «(.+) d» и «(.+): «. Затем в базе ищется совпадения. Если результатов больше, чем одно, ставим как тег.
    Бывают косяки или просто одинаковые названия, поэтому пришлось просматривать вручную и добавлять в исключения. Также ситуация с Джеймсом Бондом, Бэтменом, Риддиком и еще несколькими фильмами неординарная — тут только вручную. Всего получилось 276 подборок частей.
  • Актеры
    Спарсил инфу с Кинопоиска для актеров, которые сыграли хотя бы в 4-х фильмах — получился 1901 актер. Заморачиваться с непопулярными не стал (а их больше 50К). Для каждого прописывается шаблон текста, при желании можно добавить уник описание. Для ТОП 100 скорее всего закажу тексты.
    Фото спарсил для тех, кто сыграл в 2-х и более фильмах. На странице с фильмом выводится подобный список:
  • Режиссеры
    Аналогично актерам, только без фоток. Режиссеров, снявших более 4-х фильмов получилось 679.
  • Рейтинг
    Рейтинг парсится с Кинопоиска. Собственный рейтинг есть, но он будет не объективен, особенно для старых фильмов.
  • Сортировки
    По дате, популярности или рейтингу + страна + год. Т.е. можно на автомате получить кучу НЧ-запросов. К примеру «Лучшие китайские боевики 2015 года».
    Популярные формируются на основе Wordstat.
  • Поиск
    Ну тут совсем просто — ищем по названиям. Поиск регистронезависимый, игнорируем всё, кроме букв и цифр. Если введём, к примеру, «звездные войны», то найдет «Звездные войны», «Звёздные войны. Эпизод 5» и «Звездные воины». У некоторых киносайтов с этим проблемы.
  • Перелинковка
    С помощью тегов для фильма про бокс показывают фильмы про бокс; про 90-е — фильмы про 90-е. Если тегов нет (а их пока мало), то линкуется так: ищется в БД, отсортированной по популярности, сначала по трем категориям и стране. Если нет 3-х категорий, соответственно, берем две, ну или одну (если только одна). Если не добрали до нужного количества (а такое бывает), то всё то же самое, только без страны. И так до победного.
    Таким образом убивается сразу 2 зайца:
    1. Подбираются действительно релевантные фильмы.
    2. Прокачиваются только фильмы с наибольшей частотностью по Wordstat.
  • Жалоба
    Под видео есть кнопка, чтобы могли сообщить, если видео не работает. Удобно для меня.
  • Видеофайлы и плееры
    Естественно, держать свой сервак, заливать фильмы и все такое прочее не входило в мои планы.
    Откуда брать плеера?

    Есть ВК, ОК, Мой Мир. Но с ними проблема — удаляют. Опять же новинки придется заливать самому. Из главных преимуществ — отсутствие рекламы.

    Другой вариант — сайты, типа enter.az, kset.kz, tfilm.club, tushkan.tv, которые предоставляют возможность брать iframe. Недостатки: реклама в плеере; нет выбора качества фильма; не адаптирован под мобильные устройства; нет API, т.е. придется пилить свое решение взаимодействия с этими сайтами.

    Третий вариант — так называемые видео-балансеры, которые предоставляют свою базу и API (по ID Кинопоиска). И вот у них уже с фильмами полный порядок — большая база; есть в качестве HD 720 и даже 1080; показывает на мобилках и планшетах; постоянно выходят новинки и обновляют качество.
    Из минусов — конечно же реклама. У некоторых много рекламы: поп-андеры, кликандеры, возможен слив по Вап-клику.
    Это не радует, но деваться некуда. На первое время решил юзать Moonwalk.cc, т.к. нашлось видео к 90% всех фильмов.
    Есть еще HDGO.cc, но база фильмов слабенькая (имею в виду ранние фильмы), а вот новинки заливают/обновляют оперативно, так что скорее всего переключусь на них. Они не настолько пока жадные до рекламы.

    Для примерно 700 фильмов пришлось искать другой источник. В итоге отлично подошел 1kinobig.ru. Фильмы в ВК, но так как это не премьеры, то скорее всего не удалят. Еще для 70 искал вручную в ВК. Зато теперь для всех вышедших фильмов есть видео. Сериалы я решился взять у AllSerials.net. Одна из самых огромных баз — более 10 000 сериалов/мультсериалов. Спарсил, взял коды. Единственное, что не нравится — нет указания перевода.

  • Тексты
    Заказывал на eTXT. Поначалу, конечно, наелся говна. Реально, не понимаю, как некоторые могут идти на биржу контента со столь отвратительным знанием русского языка. Сейчас для 3 сайтов меня пишут 4 автора. По 10-12 рублей за 1000 знаков. Текстами доволен. К тому же они сразу оформляют его с нужной мне разметкой. В процессе без причин отвалились трое. Просто перестали выполнять задания. Некоторые свалили с биржи, другие смотрю продолжают выполнять задания для других.
    Потрачено 67,5К рублей. Текстов есть на полгода вперед для 3-х киносайтов.
  • Домены
    Рушки. 1 — свежерег, 2 дропа, причём один явно неплохой: по 50 хостов в сутки с поиска с первых дней, есть витальные запросы, из вебархива можно вытянуть описания для фильмов 2010-2012 годов, а значит сэкономить на рерайте.
    Когда посещалка перевалит за 5К хостов/сутки, то будет смысл переехать на зону .tv или .online
  • Хостинг
    Пока на Евробайте (они не запрещают киносайты, если своевременно удалять фильмы по требованию правообладателей). Возможно позже пеереду куда-нибудь. 3 месяца халявы всем новым клиентам, пришедшим от меня!
  • Обновления и автоматизация
    Каждые 2 часа добавляются уникальные описания и страница открывается к индексации. Добавляется ссылка на главную и в sitemap.
    Раз в сутки проверяется обновления у фильмов с плохим качеством или появление видео для тех, у кого отсутствует.
    Раз в неделю проверяются новые фильмы на http://www.kinopoisk.ru/premiere/ru/
    Раз в месяц проверяется информация на Кинопоиске для новых фильмов, потому что меняется, дополняется, появляется постер, кадры и прочее.
    Раз в месяц проверяется Wordstat.
    Раз в месяц парсится информация для актеров.

    Одной из важных фишечек является то, что всё централизовано и обновляется из одного места (не из жопы). Т.е. не нужно для каждого киносайта отслеживать новинки, настраивать парсеры и прочее. Если какой-то парсер выйдет из строя (н-р, по причине смены верстки), то достаточно поправить это лишь 1 раз и все киносайты снова будут обновляться. Если добавится какой-то новый источник видео (в планах HDGO), то просто пишем парсер и видео в этом плеере автоматически появится в доп. вкладке.
    По сути всё, что от меня требуется — давать задания на бирже копирайтинга, проверять и закидывать на сайт. Все остальное автоматизировано, минимум моего участия. В общем, сделал то, к чему стремился.

  • Дубли, неуникальный контент
    Как писал выше — все страницы с фильмами закрыты от индексации, потому что нет возможности добавить сразу ко всем описание. Да и лучше добавлять 10-15 фильмов в сутки, чем бахнуть сразу 500 или тем более 5000. Ссылки с главной и категорий на такие материалы выводятся через Ajax.
    Всякие категории, сортировки, комбинации, теги, актеры, режиссеры и подборки на выходе составят более 10К страниц. Ко всем прописывать уникальные тайтлы и описания нереально. Пока страницы закрыты от индексации, т.к. для молодого сайта не стоит делать подобное. Пусть наберут траста, тогда открою с генерированным текстом по шаблону и буду собирать траф по НЧ.
  • Админка
    На первый взгляд достаточно аскетичная:
    Но лично для меня, как создателя всей этой канители, очень удобная, лёгкая, информативная и функциональная. А больше ничего и не надо!
  • Автосоздание ТЗ для копирайтеров eTXT
    Поначалу это была настоящая головомойка с задниями копирайтерам, т.к. заказывал сразу для 3-х киносайтов. Нужно было постоянно следить для каких фильмов/сериалов уже есть описания, а для каких нужно написать. Обычно я заказывал сразу на 10 дней вперед. И это было тупой рутиной. Скопировал, вставил, указал дату. Минут через 20 такой рутины реально начинаешь тупить, внимание рассеивается. Поэтому возникали ошибки. Забыл раз отметить в файле или как-то неверно проставил и все идет по пизде. Начинаешь путаться, где и что, какому копирайтеру для какого сайта выдавать.
    Сейчас же все на автомате. Создается ТЗ для копирайтеров в XML хоть на 10 дней вперед, хоть на 100 вперед. Дело 3-х щелчков мышкой!
    Это реально очень сильно облегчило заказ контента и контроль за уже заказанными описаниями.
  • Безопасность
    Сам факт, что это не паблик-скрипт, делает сайты на нём в разы защищённее! К тому же я постарался по-максимуму защитить двиг. Специально поизучал некоторые статьи и книги по взлому сайтов на PHP. Уж все «детские» ошибки точно закрыты, в этом я уверен.
    Конечно, кому надо, тот сломает и я сам знаю уязвимости (нужны для взаимодействия с внешними данными). Но без исходников их не найти.
    Ну и к тому же нераспространенность движка сильно спасает от спама в комментах — всё успешно фильтруется.
  • По мелочи (но мастхев для любого движка)
    — микроразметка;
    — хлебные крошки;
    — CSP;
    — бан всевозможных ботов, простукивалок и прочей нечисти;
    — отлавливание 404 ошибок;
    — возможность показа рекламы только для десктопа или только для мобильных пользователей;
    — сбор статистики по посещению (сколько с какого поисковика идет на конкретную страницу);
  • Чего пока нет, но планируется
    — Регистрации пользователей. Не знаю, нужна ли. По идее можно сделать запоминание просмотренных фильмов, составление списков просмотренных, виш-листов, отсутствие рекламы. Но пока смысла в этом не вижу, да и опять потрачу на это месяц-другой;
    — Подписки на выход новых серий по e-mail, уведомления о выходе фильма или появление фильма в нормальном качестве; — Кабинета для контент-менеджера (найму, когда сайт выйдет на окупаемость);
    — Интеграции с сервисом «Переобход страниц» на webmaster.yandex.ru;

Потратил еще кучу времени на мелочи. К примеру, мне самому очень нравятся фильмы в переводе Гоблина. Поэтому потратил целый день, чтобы найти видео к ним. Ну и тут свои нюансы: некоторые фильмы идут только со звуком с TS (как будто в банку говорит), потому что были спец. показы, а сами фильмы с переводом не выходили на DVD и не релизились.

Каких-то фильмов не оказалось в базе Мунволка и пришлось писать дополнительные парсеры.
Раз десять пересматривал базу, что-то добавлял, что-то удалял. Стукало в голову «А надо вот так» и приходилось делать, переделывать.
Также делал самостоятельно подборку криминальных комедий про гетто (типа «Не грози южному централу»), фильмы по рэпу, хип-хопу. Просто потому, что мне это самому вкатывает и в своё время искал подобное.

Также делал подборки «фильмы по книгам». Оказалось, что около 1000 фильмов, которых нет в базе (их никто не ищет, но в подборках они должны быть!). Пришлось допарсивать.

В общем, мелочей, нюансов оказалась целая прорва. Сделать сам движок — это по сути дело одной-двух недель. Но мелочи съедают все остальное. А без них смысла нет делать свою CMS

В ИТОГЕ

Получился самообновляемый полноценный кинотеатр не хуже, чем большинство. На мой субъективный взгляд, конечно, лучше. Можно спокойно делать как универсальные киносайты, так и нишевые по сериалам, мультсериалам, аниме, документалкам.

По-хорошему надо было сделать простенький прототип, начать наполнять, а потом просто допиливать в «полевых условиях». Но ебаный перфекционизм требовал сделать сначала одно, потом другое и т.д. На некоторых этапах возникали проблемы, накатывала лень или бесила рутина. И поэтому всё затянулось.

Но старт дан!!!

З.Ы.

Даже если из всего этого ничего не выйдет, всё заглохнет, я потреяю интерес к киносайтам, то я не жалею этого времени. Во-первых, это опыт. Во-вторых, интересно что-то разрабатывать, пусть даже это велосипед. Только те, кто умеет кодить, поймут, насколько круто написать скрипт, парсер, сервис, движок, который делает именно то, что ты хочешь. В которым ты разбираешься, знаешь каждую загогулину (но это только первое время, через полгода это будет чужой говнокод). Когда бьешься над задачей и думаешь, как бы её лучше решить и какого хрена это не пашет, если всё вроде верно написано! Когда приходится переписывать код из-за того, что вначале что-то не до конца продумал. Но на выходе получается как раз-таки то, что устраивает.

 

Источник: Санчапанчо

+3
Мне не нравитсяМне нравится (+3 баллов, 3 оценок)
Источник:

4 комментария

Комментарии (4)


Артем

19.06.16 6:59

Очередной кино ГС сляпал как всегда. Уверен на 100%. Начинался форума зерокула =))))


Зеус

18.06.16 6:32

Задроченый Киного говорите, дай бог чтобы вы хоть на минимальный уровень посещаемости, и топ позиций вышли как киного


вадим

17.07.16 9:18

а про монетизацию что ничего не написал?


Online Василий

30.11.16 7:15

Вот честно не понимаю людей которые делают киносайты в доменной зоне RU или РФ.Ведь такие домены проще прикрыть РНК вроде как?


Выскажи свое мнение

* поля обязательны для заполнения


ТОП 5 за месяц

  • Неизвестно

Полезные ресурсы