удаление "двойников"

Аватар пользователя Антонина82
Forums: 

Когда я объединяю писателя, часто возникает ситуация, что одно и то же произведение, но в разное время залитое (один формат fb2), появляется в списке. Программа предлагает мне удалить худший экземпляр. Но поскольку я не обладаю багажом знаний в создании электронных книг, то по короткому вопроснику не могу судить, какой вариант лучше. Для начала список
Бойлен Клер «Эмма Браун»
Наменский Артём «Недра»
Норвилл Мэннинг - "Шаар - скиталец будущего"
Олдисс Брайан Уилсон - "Беспосадочный полет"
"Долгие сумерки Земли"

Янссон Туве - "Волшебная зима"
"Маленькие тролли или большое наводнение"

Брумель Валерий - "Не измени себе"

Наличие в библиотеке двух ОДИНАКОВЫХ книг ни к чему.Наверное, будет лучше, указывать в этой теме о наличии "двойников", а продвинутые пользователи библиотеки будут решать какой экземпляр оставить.

Аватар пользователя ProstoTac


Уважаемый Lyka! Много раз говорил - разные годы, разные издательства - имеют право быть представлены разными файлами. Ну это, конечно, на мой скромный взгляд. Но здесь присутствует и разница в "наполнении" - вторая книга издания 2016/2004 гг. отличается от издания 2017г. рассказом «Парик» («Шлем») и переводчиками этих рассказов. Вы же сами видите...

ProstoTac написал:
Lyka написал:
http://lib.rus.ec/b/8783 и 3http://lib.rus.ec/b/8783

Уважаемый Lyka! Много раз говорил - разные годы, разные издательства - имеют право быть представлены разными файлами. Ну это, конечно, на мой скромный взгляд. Но здесь присутствует и разница в "наполнении" - вторая книга издания 2016/2004 гг. отличается от издания 2017г. рассказом «Парик» («Шлем») и переводчиками этих рассказов. Вы же сами видите...

Проглядел.

Дубль автора http://lib.rus.ec/a/58417 и http://lib.rus.ec/a/233625 - разные переводчики перевели имя поразному Maxwell Maltz - Максуэлл Мольц Максвелл Мольц.
Да и в самой книге путаница - приписали серию другую.
.
http://lib.rus.ec/b/120477 http://lib.rus.ec/b/244760
http://lib.rus.ec/b/647908 http://lib.rus.ec/b/241635

лишний дубль хоть и др. издание
http://lib.rus.ec/b/648000
текст 1:1 со старым, есть опечатки

Аватар пользователя ProstoTac

NickNem написал:
лишний дубль хоть и др. издание
http://lib.rus.ec/b/648000
текст 1:1 со старым, есть опечатки

Естественно, переводчик один. Наверное, надо бы табличку прицепить "Разные издания - разные файлы".
Аватар пользователя sd

Может пора добавить правило: если текст и иллюстрации разных изданий одинаковы, а отличие в обложка, - не надо добавлять новый файл, а просто на странице "Обсудить книгу" указать издание и прикрепить файл с обложкой?

sd написал:
Может пора добавить правило: если текст и иллюстрации разных изданий одинаковы, а отличие в обложка, - не надо добавлять новый файл, а просто на странице "Обсудить книгу" указать издание и прикрепить файл с обложкой?

ПростоТак против.
Я - за.
Можно добавлять в аннотацию "издано так-же в серии...." и обложку. Ну и в базе на сайте прописать серию.
Аватар пользователя ProstoTac

Lyka написал:
sd написал:
Может пора добавить правило: если текст и иллюстрации разных изданий одинаковы, а отличие в обложка, - не надо добавлять новый файл, а просто на странице "Обсудить книгу" указать издание и прикрепить файл с обложкой?

ПростоТак против.
Я - за.
Можно добавлять в аннотацию "издано так-же в серии...." и обложку. Ну и в базе на сайте прописать серию.

Поймите, это не я "против". По моим наблюдениям против сам ЛИБРУСЕК, потому что устоявшаяся тенденция (или устоявшееся правило): разные издания - разные файлы. Я ни при чем, количество фактов существования разных изданий с одним текстом (псевдодублей) само за себя говорит. Тем более, если дисковое пространство сервера позволяет. Тем более, что в "бумажных" библиотеках так бы и было и есть...
Аватар пользователя ProstoTac

sd написал:
Может пора добавить правило: если текст и иллюстрации разных изданий одинаковы, а отличие в обложка, - не надо добавлять новый файл, а просто на странице "Обсудить книгу" указать издание и прикрепить файл с обложкой?

А откуда Вы знаете, что текст одинаков? А если отличие в 5 словах? В 20 словах? То есть когда тексты считать одинаковыми?
Я не зануда, а хочу точно установить критерий "одинаковости" текста.
И еще: "добавить правило" куда? К обработке "двойников"? А как мы узнаем о принятии такого "правила" библиотекарями?
По мне, так оставить все на усмотрение библиотекарей. Независимо от того, кто из нас за что "против" или "за". Если они справляются с обработкой "двойников"...

ProstoTac написал:
sd написал:
Может пора добавить правило: если текст и иллюстрации разных изданий одинаковы, а отличие в обложка, - не надо добавлять новый файл, а просто на странице "Обсудить книгу" указать издание и прикрепить файл с обложкой?

А откуда Вы знаете, что текст одинаков? А если отличие в 5 словах? В 20 словах? То есть когда тексты считать одинаковыми?
Я не зануда, а хочу точно установить критерий "одинаковости" текста.

Пожалуй надо будет написать что является критерием одинаковости текстов для меня.
Как определяется одинаковость? При объединении текстов подсвечивается разница. Если разница только в FB-info - кандидат в дубль.
Если разница в ошибках OCR... Как вариант - вычитывать текст.
Если разница в собственных именах, нечастых или специфических словах... Как вариант - сверять с бумагой, для изданных.
Далее смотрим в самый низ, где лежат картинки из файлов. Можно их просмотреть.
Это если кратко. Если расписывать все варианты, то выйдет раз в двадцать больше.
.
http://lib.rus.ec/b/575445 СИ http://lib.rus.ec/b/638136 Литрес - полный дубль.
http://lib.rus.ec/b/67500 (1991) http://lib.rus.ec/b/648357 (2015) - издательский дубль (выкинуто авторское предисловие)

http://lib.rus.ec/b/648650 http://lib.rus.ec/b/559717 полный дубль, только id перебили
http://lib.rus.ec/b/637826 http://lib.rus.ec/b/637833 в чем разница не знаю.
http://lib.rus.ec/b/488289 http://lib.rus.ec/b/473308
http://lib.rus.ec/b/146322 http://lib.rus.ec/b/543368 разница - в кавычках, Земля\Солнце с большой\маленькой, несколько артиклей пропало, части цифрами\буквами....

Аватар пользователя s_Sergius

Lyka написал:
http://lib.rus.ec/b/648650 http://lib.rus.ec/b/559717 полный дубль, только id перебили

Объединил в пользу ранней версии.


Lyka написал:
http://lib.rus.ec/b/637826 http://lib.rus.ec/b/637833 в чем разница не знаю.

Первая — сборник [рассказы, письма], вторая — отдельное произведение. Не дубли (с моей точки зрения).



Обе — сборники, состав совпадает только частично.


Lyka написал:
http://lib.rus.ec/b/146322 http://lib.rus.ec/b/543368 разница - в кавычках, Земля\Солнце с большой\маленькой, несколько артиклей пропало, части цифрами\буквами....

Рискнул объединить в пользу новой версии.

Согласен

http://lib.rus.ec/s/32488
Романы делятся.
И например, первый - перевод один, последняя версия - откорректировано корректором.

Здравствуйте, удалите, пожалуйста, автора http://lib.rus.ec/a/283273 - ни одной книжки, и, я так понимаю, просто дубль http://lib.rus.ec/a/215988. Спасибо.

Аватар пользователя s_Sergius


Объединил в пользу более новой версии, хоть она и c LITRU. В ней туча исправлений по тексту.



Из этой пары оставил старую версию, так как разница между ними несущественна.
Аватар пользователя W_Z

Ю. Сотник. Дрессировщики

http://lib.rus.ec/b/148282
этот файл помечен Знаком качества. но я, когда читал его, поправил разбивку абзацев, опечатки.

залил свой вариант:
http://lib.rus.ec/b/651669
не могу ни объединить, ни удалить старый вариант

спасибо

Аватар пользователя s_Sergius

Объединил.

http://lib.rus.ec/b/314054 без обложки и форзаца. без персонажей повести http://lib.rus.ec/b/625821 все это есть, но отличие в нумерации глав\выделении "* * *" - как в бумаге - не знаю.
http://lib.rus.ec/b/527639 http://lib.rus.ec/b/157840
http://lib.rus.ec/b/527632 http://lib.rus.ec/b/164704

http://lib.rus.ec/a/27972 и неправильное http://lib.rus.ec/a/109908
http://lib.rus.ec/b/538056 http://lib.rus.ec/b/479879

http://lib.rus.ec/b/651960 и http://lib.rus.ec/b/652176 - по-моему, в плане текста одинаковые. Думаю, можно http://lib.rus.ec/b/652176 удалить.

la-stryge написал:
http://lib.rus.ec/b/651960 и http://lib.rus.ec/b/652176 - по-моему, в плане текста одинаковые. Думаю, можно http://lib.rus.ec/b/652176 удалить.

Не так, объединил в пользу второй, в первой ошибки OCR (опущения пола, Тестер вместо Гестера...) см. http://lib.rus.ec/b/652176/diff/651960

Согласна, спасибо. Зато в первой прилагалась картинка из книжки)

la-stryge написал:
Согласна, спасибо. Зато в первой прилагалась картинка из книжки)

Перекинул картинку.

Спасибо большое )

Аватар пользователя Антонина82

Это не двойники. Книги разных авторов с одинаковым названием. Случается...

http://lib.rus.ec/a/229480 тройняшки

Аватар пользователя Антонина82

Исправила.

http://lib.rus.ec/b/437616 http://lib.rus.ec/b/645704 издательский дубль. Но первый плохо вычитан.

http://lib.rus.ec/b/653425 и http://lib.rus.ec/b/653856 - было бы чудесно объединить в одно, или оставить что-то одно. Две книжки - перебор. Спасибо.

http://lib.rus.ec/b/653377 и http://lib.rus.ec/b/654220 - удалите, пожалуйста, один из, на ваше усмотрение. Спасибо.
http://lib.rus.ec/b/654084 и http://lib.rus.ec/b/654216 - аналогично.

Поставьте, пожалуйста, книге http://lib.rus.ec/b/355392 в серии Романтическая фантастика номер 5
Поставьте, пожалуйста, книге http://lib.rus.ec/b/371370 в серии Романтическая фантастика номер 21
Удалите, пожалуйста, серию http://lib.rus.ec/s/57190
Спасибо)

Можно уже не ждать исправлений, да?

Аватар пользователя Drunkenmunky

la-stryge написал:
Можно уже не ждать исправлений, да?

Возможно что-то не получается.
Подозреваю, что проблему можно решить и самостоятельно.
Но есть нюанс.
Можно попробовать решить её через альтернативный домен.
Так же роль может играть ваша версия браузера - попробуйте более-менее современный.
P.S. Хотя, нет. Только сейчас заметил значок качества. Тут только модеров звать, да.
Аватар пользователя Colourban

la-stryge написал:
Можно уже не ждать исправлений, да?

Исправлено

http://lib.rus.ec/b/648042, http://lib.rus.ec/b/582703 и http://lib.rus.ec/b/445413 - перевод, вроде бы один. Может быть, имеет смысл и оставить только одну книгу, несмотря на разные издания?

Аватар пользователя ProstoTac

Очень странно - b/654150 и b/140701 издание одно и то же, а набор иллюстраций немного разный.

ProstoTac написал:
Очень странно - b/654150 и b/140701 издание одно и то же, а набор иллюстраций немного разный.

Можно сверить по Djvu ^http://publ.lib.ru/ARCHIVES/B/''Biblioteka_Sovetskoy_Fantastiki''/Ahmetov_S.F._Almaz_''Shah''._Sb.(1982).[djv-fax].zip
ИМХО для текстов времен доинтернетных Фидошных это характерно (библиотека Fidonet и КО). Ходило много вариантов одного текста. Набирались вручную энтузиастами, поэтому ошибки были не редкость. Как и лакуны в текстах. (ну отвлекла человека от набора текста работа). И требуется сверка с бумажными оригиналами.

http://lib.rus.ec/b/441882 СИ и отредактированный печатный http://lib.rus.ec/b/596902
http://lib.rus.ec/b/654638 http://lib.rus.ec/b/640991 полный дубль, обложки разные
.
Интересная ситуация: http://fb9.online/b/618941 (СИ - Либрусек) и http://fb9.online/b/626071 (Литрес)
Первый - 12.03.2017, второй - 16.05.2017.
ID - один. Но в Литресовском - втором появился автор файла. Т.е. уже и Литрес пиратствует?
Да и текст редактированный!
Аналогично http://fb9.online/b/646242 http://fb9.online/b/646242
.
http://lib.rus.ec/b/654869 http://lib.rus.ec/b/438269 текст один, только издательская аннотация совравши... попадает все таки в 1929 год...

Аватар пользователя ProstoTac

Но в Литресовском - втором появился автор файла. -On84ly в качестве автора очень часто присутствует в литресовских файлах. Можно верить...
Так что b/626071 - Литрес, а b/618941 ёфицированный СИ с издат. обложкой. Почему ID одинаковый - х.з.
Аналогично b/646242 и b/641500

ProstoTac написал:
Но в Литресовском - втором появился автор файла. -On84ly в качестве автора очень часто присутствует в литресовских файлах. Можно верить...
Так что b/626071 - Литрес, а b/618941 ёфицированный СИ с издат. обложкой. Почему ID одинаковый - х.з.

Если я правильно помню, то ID есть результат работы генератора случайных чисел... В принципе, можно посмотреть, можно ли в другой файл можно засунуть.
Получается On84ly взял файл с Либрусека, слегка подредактировал текст и отдал в Литрес.
Аватар пользователя ProstoTac

Lyka написал:
ProstoTac написал:
Но в Литресовском - втором появился автор файла. -On84ly в качестве автора очень часто присутствует в литресовских файлах. Можно верить...
Так что b/626071 - Литрес, а b/618941 ёфицированный СИ с издат. обложкой. Почему ID одинаковый - х.з.

Если я правильно помню, то ID есть результат работы генератора случайных чисел... В принципе, можно посмотреть, можно ли в другой файл можно засунуть.
Получается On84ly взял файл с Либрусека, слегка подредактировал текст и отдал в Литрес.

Нет, я бы так не сказал. Файлов автора On84ly на литресе слишком дофига, что бы такое предположить. И не слегка, совсем не слегка, а прилично поредактировано.

Страницы

X