Вопрос или проблема
Для моей кандидатской диссертации я собираю тысячи pdf и word документов с лекциями, транскрипциями, слайдами PowerPoint и раздаточными материалами.
У меня также есть несколько тысяч записей лекций и интервью.
Я ищу программное обеспечение, которое позволит мне загружать все это, сопоставлять, помечать, добавлять метаданные и иметь возможность искать и организовывать их по дате, месту, аудитории или теме.
В идеале такое программное обеспечение должно позволять создавать составные объекты, состоящие из нескольких записей, документов, тегов и метаданных. Например, составной объект может быть лекцией, которую человек прочитал в Аргентине прошлым маем, и он будет включать:
- Запись с iPhone докладчика
- Запись с звуковой системы, где испанский перевод более четкий
- Запись недавно сделанного французского перевода
- PDF документ с заметками докладчика
- PDF документ с чьей-то транскрипцией на английском языке
- PDF документ с транскрипцией, сгенерированной машиной, на испанском языке
- Краткое резюме
- Теги, такие как: Большие Данные, Twitter, MongoDB
- Метаданные, такие как:
- Дата: 15 мая 2022 года
- Событие: Конференция DataCrunch
- Аудитория: Студенты университетов
Дополнительным бонусом будет возможность создания пользовательских аккаунтов с разными правами доступа для просмотра, загрузки и редактирования этих записей.
Существует ли такое программное обеспечение? Я искал и искал, но не нашел. Раньше я писал программное обеспечение, поэтому в худшем случае, возможно, я смогу сделать это сам.
Да, это называется Облачное Хранилище.
Некоторые из основных провайдеров:
- Google Диск
- Microsoft OneDrive
- Dropbox
- Box
Что они могут сделать для вас:
- Вы можете загрузить любой файл, PDF или запись
- Есть место для комментариев к каждому файлу (я проверил сейчас на моем OneDrive, проверьте и другие, если у них есть)
- Теги не поддерживаются, но каждый документ проходит оптическое распознавание текста (OCR), это означает, что если документ содержит слова, такие как Большие Данные, Twitter, MongoDB, вы сможете их найти, используя строку поиска.
- Каждый файл имеет свои метаданные. Аудитория? Никогда не слышал об этих метаданных, но вы можете указать это в комментарии к файлу.
- Возможность делиться с различными правами доступа для просмотра, загрузки и редактирования
Для тегирования документов посмотрите на liquid text
После долгих поисков, я думаю, что ArchiveSpace довольно близок к тому, что мне нужно. Я могу загрузить все эти ресурсы и создать сложные взаимосвязи между ними. Я смогу искать, фильтровать и сортировать их на основе полей метаданных. Я также могу предоставить нескольким пользователям возможность поддерживать записи, регулируя права доступа.
Ответ или решение
Программное обеспечение для кросс-сопоставления и организации файлов и записей
В рамках вашей исследовательской работы, вы собираете огромное количество материалов, включая PDF и Word-документы, записи лекций и интервью. В таком случае важность эффективного управления этими данными невозможно переоценить. Вам требуется программное обеспечение, которое сможет не только загружать и организовывать ваши файлы, но и предоставлять возможность кросс-сопоставления, тегирования и добавления метаданных. Давайте рассмотрим возможные решения.
1. Поиск подходящего ПО
На данный момент несколько программных решений могут удовлетворить ваши потребности:
-
ArchiveSpace: Это облачное решение, которое предоставляет возможность настраивать сложные отношения между документами и записями. В ArchiveSpace вы сможете организовать ваши материалы по метаданным, таким как дата, место, аудитория и тема. Используя систему прав доступа, вы сможете управлять, кто может просматривать или редактировать записи. Это программное обеспечение идеально подходит для хранения и управления большими объемами информации.
-
LiquidText: Это приложение для работы с текстами и аннотациями может быть полезным для тегирования и работы с документами. Оно позволяет выделять важные моменты и создавать связь между документами и записями. Несмотря на то, что его возможности ограничены по сравнению с ArchiveSpace, оно может дополнить вашу работу с документами.
-
Облачные хранилища (Google Drive, OneDrive, Dropbox): Хотя эти платформы предоставляют базовую функциональность для хранения и совместного доступа к файлам, они ограничены в плане метаданных и тегирования. Тем не менее, некоторые из них (например, OneDrive) предлагают возможность комментировать файлы, что можно использовать в качестве альтернативного метода для аннотирования.
2. Создание комплексных объектов
Ваша задача создать комплексные объекты, которые объединяют разные типы материалов, как записи, PDF-документы и теги. ArchiveSpace предлагает мощный функционал для этого. Вы сможете создать объект, например, "Лекция в Аргентине", который будет включать все упомянутые элементы:
- Записати с разных устройств (iPhone и системы звука)
- PDF-документы (ноты спикера, транскрипции)
- Теги (Big Data, Twitter и др.)
- Метаданные (дата, событие, аудитория)
3. Управление доступом и пользователями
ArchiveSpace также предлагает функционал для управления пользователями. Вы сможете создавать учетные записи с различными уровнями доступа, обеспечивая безопасность ваших данных и контроль над тем, кто может вносить изменения или просматривать записи.
4. Создание собственного решения
Если существующие решения не полностью удовлетворяют ваши потребности, вы можете рассмотреть возможность разработки собственного программного обеспечения. Учитывая ваш опыт в программировании, создание специализированного приложения, которое интегрирует все необходимые функции, может оказаться оптимальным решением. Это может потребовать значительных усилий, но в долгосрочной перспективе вы получите инструмент, полностью соответствующий вашим требованиям.
Заключение
Итак, существует несколько программных решений, которые могут помочь вам в накоплении и организации ваших материалов для PhD. ArchiveSpace может стать вашим основным инструментом, обеспечивая возможность кросс-сопоставления и создания комплексных объектов. Параллельно вы можете использовать LiquidText для более детального анализа документов. Если ни одно из существующих решений не удовлетворяет ваши запросы, всегда есть возможность разработать кастомизированное программное обеспечение.
Выбор подходящей платформы зависит от ваших конкретных потребностей, объемов данных и предпочтений в управлении информацией.