ENREGISTREMENTS VOCAUX DE LANGUES AUTOCHTONES, ÉTUDES ET SERVICES DE MISE EN ŒUVRE

Numéro de sollicitation 18-22008

Date de publication

Date et heure de clôture 2018/06/18 14:00 HAE


    Description

    Préavis d’adjudication de contrat — Numéro de la demande de soumissions : 18-22008

    ENREGISTREMENTS VOCAUX DE LANGUES AUTOCHTONES, ÉTUDES ET SERVICES DE MISE EN ŒUVRE

    LE CENTRE DE RECHERCHE EN TECHNOLOGIES NUMÉRIQUES DU CONSEIL NATIONAL DE RECHERCHES DU CANADA (CNRC) SOUHAITE RETENIR LES SERVICES D’UNE ORGANISATION POUR CRÉER DES OUTILS LOGICIELS ET DES SERVICES WEB QUI RÉALISERONT LA SEGMENTATION ET L’INDEXATION AUDIO D’ENREGISTREMENTS VOCAUX DE LANGUES AUTOCHTONES CANADIENNES.

    1.0 PAC : Un préavis d’adjudication de contrat (PAC) est un avis public destiné aux fournisseurs pour leur faire part de l’intention d’un ministère ou d’un organisme d’attribuer à un fournisseur sélectionné à l’avance un contrat pour des biens, des services ou des travaux de construction, ce qui permet aux autres fournisseurs de signaler leur intérêt à soumissionner en présentant un énoncé des capacités. Si aucun fournisseur ne présente un énoncé des capacités qui satisfait aux exigences établies dans le PAC, au plus tard à la date de clôture indiquée dans le PAC, l’agent de négociation des marchés peut procéder à l’attribution du contrat au fournisseur sélectionné à l’avance.

    2.0 Contexte : Le Centre de recherche en technologies numériques du CNRC se concentre sur les logiciels de pointe pour le traitement des langues humaines, la reconnaissance de formes, l’intelligence amplifiée et l’apprentissage machine.

    2.1 Mission : Le programme Technologies des langues autochtones du Centre de recherche en technologies numériques du CNRC a pour mandat de mettre au point des technologies basées sur la parole et le texte pour contribuer à la revitalisation et à la préservation des langues autochtones en appuyant les enseignants et les étudiants des langues autochtones, en favorisant l’accessibilité des enregistrements audio et en soutenant les traducteurs et les transcripteurs des langues autochtones ainsi que d’autres langagiers. Le projet prévu au contrat consiste à promouvoir l’accessibilité des enregistrements audio en langues autochtones.

    3.0 ÉTENDUE DES TRAVAUX : L’entrepreneur sera responsable de l’élaboration, de la formation et de l’expérimentation d’algorithmes et de modèles de parole ainsi que de l’hébergement des cas de services Web pour le prototypage dans le cadre du projet. L’entrepreneur financera également les initiatives directement associées aux objectifs du projet en utilisant une partie du budget destiné aux partenaires. La plupart des livrables se divisent en deux catégories : ceux liés au sous-projet de segmentation et ceux liés au sous-projet d’indexation audio. Une troisième catégorie de produits livrables concerne les outils de transcription.
    La segmentation est le processus par lequel les limites des émissions de parole d’un enregistrement donné sont relevées, délimitées et attribuées à des locuteurs précis. Elle peut être subdivisée en segmentation des locuteurs, qui relève les segments énoncés par une personne en particulier, et en segmentation des langues, qui relève les segments dans une langue en particulier (de sorte que, par exemple, les segments d’un fichier audio en cri puissent être séparés des segments en anglais et en français). La segmentation constitue une étape nécessaire des pratiques exemplaires actuelles de la documentation des langues et a été présentée comme un obstacle important dans l’étude et la préservation des langues. L’indexation audio utilise la reconnaissance de la parole pour permettre de faire des recherches dans les enregistrements audiovisuels par contenu parlé à l’aide de recherches de texte. Cela permettra aux gens d’une communauté linguistique autochtone donnée d’accéder aux documents audiovisuels dans leur langue et d’y naviguer aisément. Contrairement à d’autres applications de reconnaissance de la parole, elle n’exige pas une transcription précise mot par mot et est plus facile à réaliser pour les langues qui ne comptent pas des milliers d’heures d’enregistrements déjà transcrits. Des outils de transcription qui amélioreront la productivité des transcripteurs humains de la parole dans des langues autochtones seront également mis au point dans le cadre du projet.

    3.1 S1. Sous-projet de segmentation des locuteurs

    L’entrepreneur doit :

    • Établir des bases de référence avec des algorithmes et des boîtes à outils publiés, évalués en fonction de données propres au domaine. Adapter, former et réévaluer en fonction de données propres au domaine.
    • Développer des algorithmes de segmentation qui fonctionnent de gauche à droite avant que l’enregistrement complet ne soit terminé. Faire des comparaisons avec le rendement d’algorithmes conventionnels.
    • Élargir les méthodes de vérification des locuteurs afin d’exploiter l’information fournie par utilisateur pour étiqueter tous les segments énoncés par un locuteur donné.
    • Adapter les méthodes en vue d’une utilisation interactive, comme la recherche d’un locuteur par l’exemple.

    S2. Sous-projet de segmentation des langues
    L’entrepreneur doit :

    • Établir des bases de référence avec des algorithmes et des boîtes à outils publiés, évalués en fonction de données propres au domaine. Procéder à l’adaptation, à la formation et à la réévaluation en fonction de données propres au domaine.
    • Élargir les méthodes d’identification des langues afin de segmenter les enregistrements qui comportent de nombreuses langues. Produire un algorithme de segmentation des langues qui fonctionne de gauche à droite sans enregistrement complet.
    • Combiner la segmentation des locuteurs et des langues (ce qui exige de reconnaître le même locuteur dans des langues différentes).
    • Évaluer l’utilité et l’accélération de la transcription par rapport à des méthodes existantes.

    A. Sous-projet d’indexation audio

    L’entrepreneur doit :

    • Développer des capacités de recherche d’un mot par l’exemple en se basant sur l’audio ou la représentation phonétique sous-jacente.
    • Résoudre des problèmes propres aux langues autochtones relativement à un dictionnaire d’entraînement à la prononciation et à un modèle de formation linguistique à partir du texte. Former des modèles acoustiques à partir de grandes quantités d’enregistrements transcrits dans une langue. Travailler à la validation, à la normalisation et à l’épuration, notamment, de données sonores et textuelles.
    • Concevoir des méthodes de formation multilingue en vue de rassembler de petites quantités d’enregistrements transcrits, une formation partielle ou non supervisée.
    • Réunir les éléments de reconnaissance de la parole afin d’offrir un service d’indexation et de recherche par mot-clé.

    T. Sous-projet d’outils de transcription

    L’entrepreneur doit :

    • Créer des logiciels destinés à un outil de transcription assisté par ordinateur, à la fois pour le bureau et sous forme de service Web (comprenant l’intégration dans un logiciel de transcription existant).

    3.2 Compétences de l’organisation retenue

    L’organisation retenue en tant qu’entrepreneur doit :

    • Posséder de solides compétences dans le domaine de la reconnaissance du locuteur (par exemple, des résultats concluants dans le cadre d’évaluations internationales de reconnaissance du locuteur).
    • Posséder de solides compétences dans le domaine de la reconnaissance de la parole (par exemple, des résultats concluants dans le cadre d’évaluations internationales de reconnaissance de la parole).
    • Avoir des antécédents établis dans le transfert de la technologie de la parole — plus particulièrement des systèmes d’indexation audio et de reconnaissance de la parole — à d’autres organisations, à la fois pour les secteurs privé et public.
    • Avoir des antécédents établis dans la prestation de services Web accessibles au public reposant sur la technologie de la parole.
    • Être en mesure de communiquer avec le CNRC dans les deux langues officielles.

    4.0 Livrables et attentes

    (Les livrables sont énumérés par trimestre — p. ex., « T1 » fait référence à un livrable prévu à la fin des trois premiers mois du projet).

    1. Deux réunions/ateliers mobilisant tous les participants au projet : T4 et T8.
    2. Version 1 des outils de transcription assistés par ordinateur (segmentation des locuteurs en ligne et segmentation des langues en ligne) : T4.
    3. Recherche par mot-clé des langues L1 et L2 : T5.
    4. Version 2 des outils de transcription assistés par ordinateur (étiquetage des locuteurs actifs; segmentation conjointe des locuteurs et des langues) : T6.
    5. Composantes de reconnaissance vocale des langues à ressources restreintes L3 et L4 : T6
    6. Recherche par mots-clés pour les langues L3 et L4 : T7

    5.0 Justification pour le fournisseur sélectionné à lavance : Le CNRC souhaite accorder un contrat à fournisseur unique au Centre de recherche informatique de Montréal (CRIM). Le CRIM a été retenu dans le cadre de cet accord, car il est le seul fournisseur connu qui possède l’ensemble unique de compétences pour développer et perfectionner par l’expérimentation les algorithmes et les modèles de la parole requis afin de segmenter et d’indexer des fichiers de la parole dans certaines langues autochtones canadiennes, ainsi que pour assurer la formation connexe.

    6.0 Ce marché est assujetti aux accords commerciaux suivants :

    Accord sur le commerce intérieur (ACI)

    Accord de libre-échange nord-américain (ALENA)

    Accord sur les marchés publics de l’Organisation mondiale du commerce

    7.0 Exceptions au Règlement sur les marchés de lÉtat : Un seul fournisseur est en mesure d’effectuer le travail. Exclusions ou raisons justifiant le recours à l’appel d’offres limité.

    Lorsque, du fait qu’il s’agit de travaux d’art ou pour des raisons liées à la protection de brevets, de droits d’auteur ou d’autres droits exclusifs ou de renseignements de nature exclusive, ou en l’absence de concurrence pour des raisons techniques, les produits ou services ne pourront être fournis que par un fournisseur particulier et qu’il n’existera aucun produit ou service de rechange ou de remplacement raisonnablement satisfaisant.

    8.0 Titre de propriété intellectuelle : Le titre de propriété intellectuelle qui découle du contrat proposé reviendra à l’entrepreneur.

    9.0 Droit du fournisseur à soumettre un énoncé des capacités : Les fournisseurs qui, selon eux, sont pleinement qualifiés et disponibles pour la prestation des services décrits dans le PAC ont jusqu’à la date de clôture pour soumettre un énoncé des capacités par écrit à la personne-ressource indiquée dans le présent document. L’énoncé des capacités doit clairement démontrer de quelle façon le fournisseur répond aux besoins mentionnés.

    10.0 Envoyer toute demande de renseignements et tout énoncé des capacités à :

    Conseil national de recherches Canada — Katie Homuth — 613-998-7763

    Courriel : Katie.Homuth@nrc-cnrc.gc.ca

    La solicitation ferme 18 juin 2018 14 :00 HAE

    11.0 Valeur estimative du contrat : De 900 000 $ à 1 200 000 $ CAN

    La période du contrat s’étend sur 22 mois, du 1er juin 2018 au 31 mars 2020.

    12.0 Fournisseur : Centre de recherche informatique de Montréal — 405, avenue Ogilvy, bureau 101, Montréal (Québec) H3N 1M3

    Durée du contrat

    Voir la description ci-dessus pour voir tous les détails.

    Accords commerciaux

    • Accord sur les marchés publics de l'Organisation mondiale du commerce (AMP-OMC)

    Former un partenariat avec une autre entreprise

    La fonctionnalité permettant d'ajouter le nom de votre entreprise à la liste des entreprises intéressées est temporairement indisponible.

    Cette liste ne remplace pas et n'affecte pas les procédures de l'appel d'offres pour ce processus d'achat. Les entreprises doivent tout de même répondre aux demandes de soumissions et concurrencer en fonction des critères établis. Pour plus d'informations, veuillez lire les conditions d'utilisation.

    Coordonnées

    Organisation contractante

    Organisation
    Conseil national de recherches du Canada
    Adresse
    100, promenade Sussex
    Ottawa, Ontario, K1A0R6
    Canada
    Autorité contractante
    Homuth, Katie
    Numéro de téléphone
    613-998-7763
    Adresse courriel
    Katie.Homuth@nrc-cnrc.gc.ca
    Adresse
    1200 Montreal Road
    Ottawa, ON, K1A 0R6
    CA

    Organisation(s) d'achat

    Organisation
    Conseil national de recherches du Canada
    Adresse
    100, promenade Sussex
    Ottawa, Ontario, K1A0R6
    Canada
    Détails de l'offre

    Les détails de cette occasion se trouvent sous l’onglet Description.

    Veuillez communiquer avec l’agent(e) de négociation des contrats pour obtenir la documentation complète de la sollicitation, ainsi que l’information reliée aux accès requis pour soumissionner, ou pour toutes autres questions au sujet de cette occasion de marché.

    Il pourrait y avoir des frais reliés à l’accès de documents ou pour soumissionner. Ces frais, le cas échéant, sont indiqués sous l’onglet Description.

    Il est recommandé de communiquer avec l’agent(e) de négociation des contrats le plus rapidement possible puisqu’il pourrait y avoir des échéances limitant les périodes de questions.

    Admissibilité et conditions d’utilisation

    Les occasions de marché du gouvernement du Canada, ainsi que les avis d’attribution, les documents de sollicitations et autres documents sont disponibles sans frais sur AchatsCanada, sans devoir s’inscrire.

    Les informations peuvent être disponibles sur une autre source avant d'être disponibles sur AchatsCanada. Vous avez peut-être reçu ces informations via un distributeur tiers. Le gouvernement du Canada n'est pas responsable des avis d'appel d'offres ou des documents et pièces jointes qui ne sont pas accédés directement à partir d’AchatsCanada.canada.ca.

    Les appel d'offres ou avis d'attribution du gouvernement du Canada sont titulaire d’une licence du gouvernement ouvert - Canada qui régit son utilisation. Les documents de sollicitation et / ou les pièces jointes à l'appel d'offres sont protégés par le droit d'auteur. Veuillez consulter les conditions d’utilisation pour obtenir plus d'information.

    Détails

    Type d’avis
    Préavis d’attribution du contrat
    Langue(s)
    Anglais, Français
    Région(s) de livraison
    Région de la capitale nationale (RCN)
    Région de l'appel d'offres
    Région de la capitale nationale (RCN)
    Méthode d'approvisionnement
    Concurrentielle – Appel d’offres limité

    Soutien aux petites et moyennes entreprises

    Si vous avez des questions concernant cette occasion de marché, veuillez communiquer avec l'agent de négociation des contrats, dont les coordonnées se trouvent sous l'onglet Coordonnées.

    Consultez notre page de soutien si vous avez besoin d'aide ou si vous avez des questions sur le processus d'approvisionnement du gouvernement, y compris sur la façon de soumissionner ou de s'inscrire dans SAP Ariba. Vous pouvez également contacter Soutien en approvisionnement Canada, qui dispose de bureaux à travers le Canada.

    Date de modification: